Wyniki wyszukiwania dla: cyfrowy korektor mowy - MOST Wiedzy

Wyszukiwarka

Wyniki wyszukiwania dla: cyfrowy korektor mowy

Wyniki wyszukiwania dla: cyfrowy korektor mowy

  • Cyfrowy system rejestracji i rekonstrukcji sygnału mowy dla potrzeb Lotnictwa Wojskowego.

    Publikacja

    - Rok 2004

    W referacie przedstawiono ogólną charakterystykę opracowanego systemu rejestracji i rekonstrukcji sygnału mowy. Zamieszczono opis poszczególnych składników systemu, które stanowi zestaw zaawansowanych narzędzi do rejestracji, analizy i rekonstruowania mowy, zrealizowany w formie oprogramowania komputerowego. Narzędzia te pozwalają na szybkie wyszukiwanie pożądanych fragmentów nagrań oraz poprawę ich jakości na drodze redukcji szumów,...

  • Metoda oceny skuteczności cyfrowego korektora mowy

    Cyfrowy korektor mowy, który został opracowany w Katedrze Inżynierii Dźwięku i Obrazu PG, jest urządzeniem pozwalającym na poprawę płynności mowy osób jąkających się z wykorzystaniem nowego typu metodykę modyfikacji audytoryjnej pętli sprzężenia zwrotnego. W niniejszej pracy zawarto podstawowe informacje na temat wady wymowy, jaką jest jąkanie się oraz na temat opracowanego korektora.

  • Nowy system cyfrowej transmisji sygnału mowy o szybkości 16 kbit/s

    Celem pracy jest przedstawienie nowego systemu cyfrowej transmisji sygnału mowy wykorzystującego kanał cyfrowy o prędkości transmisji 16 kbit/s. Nowa metoda kodowania sygnału mowy zaproponowana w pracy pozwala zmniejszyć czterokrotnie, w porównaniu z telefonią cyfrową, wymaganą szybkość transmisji, przy zachowaniu akceptowanej jakości przesyłanej mowy, a jednocześnie nie wymaga drogich numerycznie algorytmów wykorzystywanych w...

  • New generation artificial larynx

    Publikacja

    Celem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz....

  • Przetwarzanie dźwięków i obrazów

    Kursy Online
    • P. Odya
    • J. Kotus
    • S. Cygert
    • B. Kostek
    • G. Szwoch
    • A. Czyżewski
    • M. Szczodrak

    Cyfrowy tor foniczny i wizyjny. Elementy grafiki komputerowej i jej przetwarzania. Zniekształcenia dźwięku i obrazu, ich przyczyny i podstawowe metody ograniczania. Przetwarzanie brzmienia i synteza dźwięku. Podstawowe metody przetwarzania obrazu wizyjnego. Kodowanie  dźwięku w  procesie  zapisu. Filtracja cyfrowa i metody projektowania filtrów cyfrowych. Podstawowe metody przetwarzania obrazu wizyjnego. Specjalne metody przetwarzania...

  • Metodyka oceny skuteczności cyfrowego korektora mowy

    Publikacja

    - Rok 2003

    W pracy zawarto podstawowe informacje na temat jąkania i zasad działania korektora. Skupiono się na zagadnieniu oceny postępów w terapii z wykorzystaniem ankiet i tzw. próby sylabowej. Zawarto również wyniki wstępnych analiz materiałów przesyłanych z poradni. Ponadto opisano krótko algorytmy które posłużą do automatycznej detekcji zaburzeń mowy.

  • KORPUS MOWY ANGIELSKIEJ DO CELÓW MULTIMODALNEGO AUTOMATYCZNEGO ROZPOZNAWANIA MOWY

    W referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus...

  • Bożena Kostek prof. dr hab. inż.

  • Akustyka Mowy - 2022

    Kursy Online
    • J. Kotus
    • G. Szwoch
    • A. Czyżewski

    Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.

  • Akustyka Mowy - 2023

    Kursy Online
    • J. Kotus
    • G. Szwoch
    • A. Czyżewski

    Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.

  • Akustyka Mowy - 2024

    Kursy Online
    • J. Kotus
    • G. Szwoch

    Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.

  • AUTOMATYCZNA KLASYFIKACJA MOWY PATOLOGICZNEJ

    Publikacja

    Aplikacja przedstawiona w niniejszym rozdziale służy do automatycznego wykrywania mowy patologicznej na podstawie bazy nagrań. W pierwszej kolejności przedstawiono założenia leżące u podstaw przeprowadzonych badan wraz z wyborem bazy mowy patologicznej. Zaprezentowano również zastosowane algorytmy oraz cechy sygnału mowy, które pozwalają odróżnić mowę niezaburzoną od mowy patologicznej. Wytrenowane sieci neuronowe zostały następnie...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Cyfrowy Urząd

    Publikacja

    - Rok 2003

    W pracy podjęto tematykę wykorzystania internetu przez administrację samorządową do obsługi mieszkańców.

  • Analiza sygnału mowy w foniatrii

    Praca zawiera opis algorytmów analizy sygnału mowy opracowanych do zastosowań medycznych. Mają one znaczenie wspomagające w diagnostyce schorzeń krtani, objawiających się jako np. chrypka, dwugłos oraz nieprawidłowa artykulacja tonu krtaniowego (głos drżący). Opisano algorytmy służące do ekstrakcji tonu krtaniowego (parametr F0 i jego przebieg zmienności w czasie) oraz do wygładzania widma (np. do estymacji parametrów formantowych...

  • Wykorzystanie analizy obrazu w rozpoznawaniu mowy

    Publikacja

    - Rok 2005

    Niniejszy referat przedstawia metodę rozpoznawania mowy na podstawie analizy ruchu ust. W pracy opisano algorytm wyznaczana i śledzenia położenia ust wykorzystujący modele Active Shape Models oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. W pracy umieszczono wyniki klasyfikacji oraz wnioski.

  • Pikselowy cyfrowy układ CDS przeznaczony do przetwornika obrazu CMOS

    W artykule zaproponowano cyfrowy układ CDS (Correlated Double Sampling) przeznaczony do przetwornika obrazu CMOS. Układ różni się od klasycznych rozwiązań tym, że dwie pamięci przechowujące próbki sygnału wizyjnego zastąpiono jednym licznikiem rewersyjnym. Dzięki tej modyfikacji możliwa jest znaczna redukcja powierzchni układu CDS i umieszczenie go w każdym pikselu przetwornika obrazu CMOS. System został zaprojektowany i przesymulowany...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Pikselowy cyfrowy układ CDS przeznaczony do przetwornika obrazu CMOS

    W artykule zaproponowano cyfrowy układ CDS (Correlated Double Sampling) przeznaczony do przetwornika obrazu CMOS. Układ różni się od klasycznych rozwiązań tym, że dwie pamięci przechowujące próbki sygnału wizyjnego zastąpiono jednym licznikiem rewersyjnym. Dzięki tej modyfikacji możliwa jest znaczna redukcja powierzchni układu CDS i umieszczenie go w każdym pikselu przetwornika obrazu CMOS. System został zaprojektowany i przesymulowany...

  • Cyfrowy akcelerator wybranych modułów standardu kompresji wideo H.264

    W artykule przedstawiono konfigurowalny cyfrowy akcelerator estymacji ruchu przeznaczony dla enkodera wideo standardu H.264. Akcelerator został zaimplementowany w technologii FPGA oraz w układzie ASIC w technologii UMC 90 nm. Obie implementacje zostały zweryfikowane, a szczegółowe wyniki pomiarów akceleratora ASIC zostały porównane z innymi dostępnymi w literaturze propozycjami. System został zoptymalizowany do współpracy z oprogramowaniem...

    Pełny tekst do pobrania w portalu

  • System rozpoznawania mowy wykorzystujący cechy wizualne

    Publikacja

    - Rok 2005

    Niniejszy artykuł przedstawia metodę rozpoznawania głosek na podstawie analizy ruchu ust, która może znaleźć zastosowanie w terapii logopedycznej osób z wadami słuchu. W pracy opisano algorytm wyznaczana i śledzenia położenia ust oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. Dodatkowo przeprowadzono...

  • Badanie jakości transmisji mowy w sieciach IP.

    Praca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telekomunikacyjnym. Zrealizowano symulację transmisji pakietowej sygnału mowy w sieci Internet (VoIP). Wykonano serię testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.

  • POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU

    Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w...

    Pełny tekst do pobrania w portalu

  • Cyfrowy biznes WETI

    Kursy Online
    • M. Ciesielska

  • Cyfrowy akcelerator wybranych modułów standardu kompresji wideo H.264

    W komunikacie przedstawiono konfigurowalny cyfrowy akcelerator estymacji ruchu (motion estimation) przeznaczony dla enkodera wideo standardu H.264. Akcelerator został wstępnie zaimplementowany w układzie FPGA VIRTEX6-VLX365T, a następnie w układzie ASIC w technologii UMC 90 nm. Obie implementacje zostały zweryfikowane pozytywnie, a szczegółowe wyniki symulacji i pomiarów akceleratora ASIC zostały porównane z innymi dostępnymi w...

  • Biometria i przetwarzanie mowy 2023

    Kursy Online
    • J. Daciuk

    {mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...

  • Biometria i przetwarzanie mowy 2024

    Kursy Online
    • J. Daciuk

    {mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...

  • Wykorzystanie sieci neuronowych do syntezy mowy wyrażającej emocje

    Publikacja

    - Rok 2019

    W niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opratych na mowie i możliwości ich wykprzystania w syntezie mowy z emocjami stosując do tego celu sieci neuronowe. Wskazano również przydatnośc parametrów typowo stosowanych do rozpoznawania mowy w detekcji emocji w śpiewie i rozróżnianiu tych emocji w obu przypadkach. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy...

  • WYKORZYSTANIE SIECI NEURONOWYCH DO SYNTEZY MOWY WYRAŻAJĄCEJ EMOCJE

    Publikacja

    W niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opartych na mowie i możliwości ich wykorzystania w syntezie mowy z emocjami, wykorzystując do tego celu sieci neuronowe. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy mowy za pomocą sieci neuronowych. Obecnie obserwuje się znaczny wzrost zainteresowania i wykorzystania uczenia głębokiego w aplikacjach związanych...

  • Badanie jakości transmisji mowy w sieciach IP.

    Praca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telefonicznym VoIP. Wykorzystano symulacje transmisji pakietowej sygnału w sieci IP. Wykonano serie testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.

  • Różnica w subiektywnej ocenie jakości mowy pomiędzy nastolatkami dwujęzycznymi a jednojęzycznymi

    Publikacja

    - Rok 2021

    Proces percepcji mowy omawiany jest w szerokim zakresie dziedzin i dyscyplin naukowych, od nauk humanistycznych, technicznych, aż po nauki medyczne. Wiele badań skupia się np. na ocenie różnicy w grupach bez i z wykształceniem muzycznym. Skoro stwierdzono, że zdolności muzyczne wpływają na percepcję poszczególnych atrybutów dźwięku, autorzy postanowili zbadać, czy zdolności językowe także mogą mieć wpływ na ocenę jakości sygnału...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Cyfrowy filtr Hilberta i jego zastosowania

    Zaproponowano efektywne rozwiązanie filtru Hilberta o skończonej odpowiedzi impulsowej i o zmiennym opóźnieniu ułamkowym. Oryginalność polega tu na tym, że filtr równocześnie realizuje filtrację zespoloną Hilberta i opóźnianie ułamkowe wejściowego sygnału o wartościach rzeczywistych. Można go więc zastosować np. w systemie GPS lub w każdym innym systemie, gdzie zachodzi jednocześnie potrzeba filtracji Hilberta i estymacji opóźnienia...

  • Filtr cyfrowy o zmiennym opóźnieniu ułamkowym

    W artykule rozważono problem projektowania szerokopasmowego filtru cyfrowego o zmiennym opóźnieniu ułamkowym. Filtr ten przeznaczony jest do zmiany szybkości próbkowania sygnału dyskretnego jako interfejs umożliwiający współpracę systemów cyfrowych, np. akustycznych lub wizyjnych, o różnych standardach szybkości próbkowania. Wówczas filtr o zmiennym opóźnieniu.

  • Novel approaches to wideband speech coding

    Publikacja

    Dwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • DWUKIERUNKOWY PRZEWODOWY SYSTEM TRANSMISJI MOWY PRZY WYKORZYSTANIU TECHNOLOGII BPL

    Publikacja

    - Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Rok 2019

    Monitorowanie pracowników w środowisku podziemnym jest niezwykle ważnym zadaniem. Z uwagi na możliwe zagrożenia, konieczne jest opracowanie niezawodnego systemu komunikacji głosowej pomiędzy personelem a przełożonym. Dzięki wysokiej odporności na uszkodzenia mechaniczne, kable zasilające pracujące w technice BPL (Broadband over Power Line) wydają się doskonałym rozwiązaniem. W pracy przedstawiono w pełni funkcjonalny dwukierunkowy...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • 2023/2024 Cyfrowy biznes (PG_00053755)

    Kursy Online
    • N. Sabatini

  • Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej

    W pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.

  • Wpływ rozmieszczenia źródeł w rozproszonym systemie rozgłoszeniowym na zrozumiałość mowy.

    Publikacja

    - Rok 2003

    Dźwiękowe systemy ostrzegawcze instalowane w obiektach użyteczności publicznej muszą zapewniać odpowiednio wysoką zrozumiałość mowy. W praktyce systemy nagłośnieniowe nie zawsze spełniają to kryterium. Referat przedstawia badania symulacyjne dwóch systemów wykorzystujących rozproszone układy źródeł.Celem badań jest określenie związków między geometrią rozkładu źródeł a zrozumiałością mierzoną parametrem RASTI.

  • Cyfrowy HR. Organizacja w warunkach transformacji technologicznej

    Publikacja

    - Rok 2023

    Publikacja jest pierwszą na rynku pozycją opisującą kompleksowo zagadnienia związane z cyfryzacją HR. Autorzy szczegółowo omawiają poszczególne aspekty procesu wdrażania rozwiązań cyfrowych, a także podkreślają kluczową rolę, jaką dział HR odgrywa w kształtowaniu nowej cyfrowej kultury organizacyjnej w firmie. W monografii omówiono zagadnienia takie jak m.in.: * nowe role HR w procesie digitalizacji firmy, * cyfrowe zarządzanie...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Jakość transmisji sygnałów mowy w systemie gsm z hoppingiem częstotliwościowym

    Publikacja

    - Rok 2005

    W pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na polepszenie charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Dotyczą one podstawowego parametru służącego do oceny jakości transmisji, jakim jest stopa błędów. W badaniach uwzględniono różne liczby częstotliwości nośnych uczestniczących w hoppingu, prędkości przemieszczania się terminali i środowiska propagacyjne.

  • Weryfikacja systemu dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

    Większość systemów dopasowania protez słuchu koncentruje się na poprawie zrozumiałości mowy. Problem dopasowania protez słuchu może w uproszczeniu być przedstawiony jako problem dopasowania szerokiej dynamiki sygnału mowy do zawężonej dynamiki uszkodzonego słuchu. Głównym celem badań było przetestowanie opracowanego systemu oraz sprawdzenie w jakim stopniu zaimplementowany moduł wirtualnej protezy słuchu może poprawić zrozumiałość...

  • A hybrid speech codec employing parametric and perceptual coding techniques

    Publikacja

    W referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...

  • Wykorzystanie algorytmu kompresji sygnału mowy MP-LPC do modelowania przebiegu fonokardiograficznego

    W artykule przedstawiono nową metodę modelowania dźwięków serca, która może znaleźć zastosowanie w systemach diagnostyki urządzeń medycznych oraz stanowić podstawę opracowania inteligentnego stetoskopu. Przedstawiona propozycja stanowi rozwinięcie algorytmu MP-LPC wykorzystywanego w kompresji sygnału mowy. Wykazano, że do dokładnego modelowania przebiegu fonokardiograficznego, który pozwala na odwzorowywanie różnorodnych stanów...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Cyfrowy system do pomiarów przebiegów niepożądanych w odbiornikach radiokomunikacyjnych.

    Zaprezentowano sposób rozwiązywania funkcjonalnego cyfrowego systemu do pomiarów przebiegów niepożądanych na wyjściu odbiornika radiokomunikacyjnego. Omówiono zalety prezentowanego systemu pomiarowego w porównaniu z zalecanymi w odnośnych normach układami pomiarowymi. Podano wybrane wyniki pomiarów parametrów określających intensywność szumów i zakłóceń na wyjściu odbiornika.

  • ANALIZA PARAMETRÓW SYGNAŁU MOWY W KONTEKŚCIE ICH PRZYDATNOŚCI W AUTOMATYCZNEJ OCENIE JAKOŚCI EKSPRESJI ŚPIEWU

    Praca dotyczy podejścia do parametryzacji w przypadku klasyfikacji emocji w śpiewie oraz porównania z klasyfikacją emocji w mowie. Do tego celu wykorzystano bazę mowy i śpiewu nacechowanego emocjonalnie RAVDESS (Ryerson Audio-Visual Database of Emotional Speech and Song), zawierającą nagrania profesjonalnych aktorów prezentujących sześć różnych emocji. Następnie obliczono współczynniki mel-cepstralne (MFCC) oraz wybrane deskryptory...

    Pełny tekst do pobrania w portalu

  • Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu

    Publikacja

    - Rok 2013

    Przedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu...

  • Interaktywne badania słuchu, wzroku i mowy

    Telemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.

  • System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results

    Publikacja

    - Rok 2005

    W artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...

  • Cyfrowa analiza mowy etnicznej - ekstrakcja kodu informacji.

    Publikacja

    - Rok 2003

    W artykule zaprezentowano spektrogramy leksemów wyartykułowanych przez (zróżnicowanych co do płci i wieku) użytkowników jednego języka etnicznego wyrażonych w mowie swobodnej. Ponadto, przedstawiono spektrogramy tychże leksemów uzyskane po cyfrowym wyeliminowaniu w nich sygnału tonu krtaniowego. Dla porównania pokazano spektrogramy uzyskane w wyniku identycznego procesu przetwarzania sygnałów będących akustyczną reprezentacją...

  • High quality speech coding using combined parametric and perceptual modules. [Kodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego]

    W komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm

    W artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Simulation of electric hearing - influence of simulation parameters on quality of output signal

    Publikacja

    - Rok 2006

    W środowisku programistycznym Matlab stworzono symulację słuchu elektrycznego pacjenta implantowanego. W symulacji zastosowano algorytm przetwarzania wykorzystywany w komercyjnych systemach implantów ślimakowych - CIS (Continuous Interleaved Sampling). W pracy zbadano wpływ ilości kanałów, jak i innych parametrów sygnałów wyjściowych przy zastosowaniu sygału mowy jako sygnału wejściowego symulacji.