Wyniki wyszukiwania dla: ANALIZA MOWY - MOST Wiedzy

Wyszukiwarka

Wyniki wyszukiwania dla: ANALIZA MOWY

Wyniki wyszukiwania dla: ANALIZA MOWY

  • Novel approaches to wideband speech coding

    Publikacja

    Dwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Multitask Noisy Speech Enhancement System

    Publikacja

    - Rok 2005

    W referacie opisano Wielozadaniowy System Poprawy Jakości Sygnału Mowy. Jest to wyspecjalizowany pakiet oprogramowania przeznaczony do rejestrowania sygnału mowy i do poprawy jego jakości oraz zrozumiałości mowy, przy użyciu zaawansowanych procedur cyfrowego przetwarzania sygnału. Pakiet oprogramowania składa się z programów: Rejestrator, Przeglądarka oraz Rekonstruktor. Oprogramowanie to może być użyte w przypadkach, gdy zrozumiałość...

  • New generation speech aid for stuttering people

    Publikacja

    - Rok 2008

    Współczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...

    Pełny tekst do pobrania w portalu

  • New generation speech aid for stuttering people

    Publikacja

    Współczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...

    Pełny tekst do pobrania w portalu

  • Głębokie przetwarzanie tekstu i sygnału mowy 2022

    Kursy Online
    • S. Cygert
    • S. Zaporowski
    • P. Szczuko

  • Głębokie przetwarzanie tekstu i sygnału mowy 2023

    Kursy Online
    • S. Cygert
    • S. Zaporowski
    • P. Szczuko
    • A. Harasimiuk

  • Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych

    Publikacja

    - Rok 2017

    Wniniejszej pracy doktorskiej opisano nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone...

    Pełny tekst do pobrania w portalu

  • Accoustic verification of onomatopoeic sets in contrastive approach

    Publikacja

    - Rok 2008

    Praca relacjonuje efekty prób wykorzystania technik cyfrowego przetwarzania sygnału mowy dla zaspokojenia specyficznych potrzeb nauk humanistycznych, które, ograniczając się wyłącznie do tra-dycyjnie stosowanego warsztatu badawczego, napotykają współcześnie na bariery znacznie blokują-ce oczekiwany postęp. Omówiono proces badawczy, który służyć ma językoznawcom dokonującym porównań wyrażeń dźwiękonaśladowczych odnajdywanych w odmiennych...

  • A hybrid speech codec employing parametric and perceptual coding techniques

    Publikacja

    W referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...

  • A system for multitask noisy speech enhancement.

    Publikacja

    - Rok 2004

    W artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy...

  • Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language

    Przedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...

  • Special hearing aid for stuttering people

    Publikacja

    - Rok 2007

    Dzięku postępowi w dziedzienie cyfrowego przetwarzania sygnałów możliwe stało zbudowanie subminiaturowego urządzenia łączącego funkcje aparatu słuchowego i korektora mowy. Takie urządzenie, mimo niewielkich rozmiarów, jest w stanie wykonywać skomplikowane alggorytmy a jego oprogramowanie może być łatwo zmieniane. W pracy skupiono się na zagadnieniach związanych z opracowniem prototypu i implementacją algorytmów korekcji słuchu...

  • Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie

    Publikacja

    - Otorynolaryngologia - Przegląd Kliniczny - Rok 2018

    W opracowaniu dokonano przeglądu dostępnych prac dotyczących różnych rodzajów urządzeń poprawiających słyszenie, które w szczególnych przypadkach mogą być traktowane jako rozwiązania alternatywne w stosunku do klasycznych aparatów słuchowych. Praca zawiera dyskusję na temat nowego rodzaju aparatu słuchowego wstępnie zaprogramowanego, który może być dystrybuowany korespondencyjnie lub bezpośrednio potencjalnym użytkownikom. Ponadto...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Application of hybrid signals processors to speech and hearing aids

    Publikacja

    - Rok 2005

    Dzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...

  • Reprezentatywne dla danego języka spektra odpowiedzi impulsowej kanału głosowego = English language specific spectrum generated in the human vocal tract

    Publikacja

    - Rok 2005

    W pracy omówiono wybrane problemy ekstrakcji kodu informacji zawartego w dźwiękach mowy etnicznej. Autorzy, wykorzystując kompilację własnych i firmowych algorytmów, wydzielają w procesie wygładzania cepstralnego z cyfrowego zapisu dźwięków mowy naturalnej strukturę spektralną pobudzenia tonem krtaniowym i szumem oraz strukturę spektralną kanału głosowego modulującego to pobudzenie. W następnym kroku powstają -statystycznie reprezentatywne...

  • New digital aids for pateints after laryngectomy

    Publikacja

    - Rok 2006

    Powrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej...

  • Korekta akustyczna sali audytoryjnej Politechniki Śląskiej w Rybniku.

    Publikacja

    - Rok 2003

    Omówiono korektę akustyczną sali audytoryjnej Politechniki Śląskiej w Rybniku. Przyczyną dokonania korekty była mała zrozumiałość mowy a powodowana nadmierną pogłosowością sali. Rozpatrzono wpływ rezonansu galerii na akustykę sali. Mimo ograniczonej ingerencji w architekturę sali związanej z zabytkowym charakterem budynku, korekta akustyczna znacząco poprawiła zrozumiałość mowy w sali.

  • Moje refleksje po ukończeniu 75 lat.

    Publikacja

    - Rok 2004

    Szkic stanowi streszczenie mowy, jaką wygłosił autor na uroczystości swego 75-lecia.

  • Online pitch estimation using instantaneous complex frequency

    Publikacja
    • M. Kaniewska

    - Rok 2011

    W pracy opisano nowe wyniki dotyczące skuteczności algorytmu potokowego estymującego częstotliwość podstawową sygnału mowy. Algorytm wykorzystuje zespoloną pulsację chwilową dla klasyfikacji mowy na dźwięczną i bezdźwięczną oraz estymacji częstotliwości podstawowej dla każdej próbki sygnału. Skuteczność klasyfikacji oraz dokładność estymacji zostały ocenione eksperymentalnie z wykorzystaniem dwóch baz nagrań, zawierających wypowiedzi...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Strategie treningu neuronowego estymatora częstotliwości tonu krtaniowego z użyciem generatora syntetycznych samogłosek

    W wielu zastosowaniach telekomunikacyjnych pojawia się problem przetwarzania lub analizy sygnału mowy, w ramach którego, często w obszarze podstawowych algorytmów, stosuje się estymator częstotliwości tonu krtaniowego. Estymator rozpatrywany w tej pracy bazuje na neuronowym klasyfikatorze podejmującym decyzje na podstawie częstotliwości oraz mocy chwilowej wyznaczanych w podpasmach analizowanego sygnału mowy. W pracy rozważamy...

    Pełny tekst do pobrania w portalu

  • Advanced speech archiving and restoration system for aviation applications

    Publikacja

    - Rok 2005

    W referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów - jest to niezwykle istotne w...

  • Konfrontowanie reprezentatywnych struktur spektralnych odpowiedzi impulsowej kanału głosowego

    Publikacja

    - Rok 2006

    Ewidentne zróżnicowanie nawyków artykulacyjnych charakterystyczne dla dźwięków mowy różnych języków zmusza do odnajdywania znaczących podobieństw nie w obrazie akustycznym mowy swobodnej, a jedynie w jej zawoalowanych fragmentach odpowiedzialnych za przekaz kodu informacji (sensu). W pracy omówiono metody i rezultaty automatycznego kwalifikowania wybranych leksemów trzech systemów języka na podstawie konfrontowania ich cyfrowych...

  • Cifrovaâ reprezentaciâ leksem russkogo âzyka

    Publikacja

    - Rok 2007

    Konfrontowanie zasobów leksyki pokrewnych systemów języka etnicznego w celu określenia stopnia zbieżności przynależnych im homonimik wymaga stosowania wysublimowanych procedur językoznawczych mających na celu oszacowanie wspólnoty akustycznej zawartej w paralelnych parlacjach użytkowników owych języków. Ewidentne zróżnicowanie nawyków aktu artykulacji a zwłaszcza, co szczególnie istotne, nieświadomego procesu intelektualnej percepcji...

  • Nowe metody przetwarzania sygnałów w wybranych zagadnieniach wibroakustyki

    Publikacja
    • R. Barański
    • A. Grzeczka
    • M. Kłaczyński
    • M. Konior
    • P. Małecki
    • G. Wszołek
    • W. Wszołek
    • T. Wszołek

    - Rok 2015

    Monografia Nowe Metody Przetwarzania Sygnałów w Wybranych Zagadnieniach Wibroakustyki będąca piętnastym Tomem z serii Monografie Katedry Automatyzacji Procesów AGH w Krakowie poświęcona jest zagadnieniom związanym z zastosowaniem i wykorzystaniem metod przetwarzania sygnałów wibroakustycznych w wybranych problemach technicznych i medycznych. W pierwszym rozdziale niniejszej monografii przedstawiono zagadnienia dotyczące metod przetwarzania...

  • Vowel recognition based on acoustic and visual features

    W artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...

    Pełny tekst do pobrania w portalu

  • Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm

    W artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • New generation artificial larynx

    Publikacja

    Celem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz....

  • Speech formant frequency and pitch estimation using instantaneous complex frequency

    Publikacja
    • M. [. Kaniewska

    - Rok 2008

    W pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.

  • New approach to localization of clicks in archive speech signals.

    Publikacja

    Przedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.

  • Korekta akustyczna sali wykładowej Politechniki Lwowskiej

    Publikacja

    - Fizyka Budowli w Teorii i Praktyce - Rok 2007

    Praca omawia korektę akustyczną sali wykładowej, cechującą się dużą pogłosowością i małą zrozumiałością mowy. Sala znajduje się w zabytkowym budynku. Przedstawiono kroki prowadzące do poprawy akustyki, z uwzględnieniem ograniczeń wynikających z historycznego charakteru sali.

  • Broadband interference in speech reinforcement systems

    Publikacja

    - Rok 2008

    Artykuł podejmuje niedoceniany problem wpływu liczby i rozkładu głośników w systemach nagłośnienia, na jakość przekazu głosowego, czyli na zrozumiałość mowy w audytoriach. Superpozycji przesuniętych w czasie szerokopasmowych sygnałów o tym samym kształcie i lekko różnych wielkościach, które docierają do słuchacza z licznych spójnych źródeł, towarzyszy zjawisko interferencji prowadzące do głębokiej modyfikacji odbieranych sygnałów...

  • Zaawansowane technologie multimedialne [Moduł dyscyplinarny, Grupa A i B]

    Kursy Online
    • B. Kostek
    • P. Szczuko
    • A. Czyżewski

    Prowadzący: prof. dr hab. inż. Andrzej Czyżewski, prof. dr hab. inż. Bożena Kostek, dr hab. inż. Piotr Szczuko Terminy realizacji zajęć: 19.11, godz. 12:00-14:45 19.11, godz. 15:30-18:15 + wykłady offline Tematyka realizowanego przedmiotu obejmuje: Telemonitoring obiektów i aglomeracji Fonoskopia i analiza obrazów Podstawy psychofizjologii słyszenia i widzenia Kodowanie perceptualne i formaty zapisu dźwięku i obrazu Podstawy...

  • On the use of instantaneous complex frequency for pitch and formant tracking.

    Publikacja
    • M. [. Kaniewska

    - Rok 2008

    W pracy opisano algorytm śledzenia częstotliwości podstawowej i formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. Działanie algorytmu przetestowano na nagraniach polskich samogłosek, których wysokość zmieniała się płynnie. Wyniki testów wraz z porównaniem działania opisanej metody i metody predykcji liniowej zawarto w artykule.

  • Józef Gołuchowski - profesor filozofii w Wilnie.

    Publikacja

    - Rok 2004

    W artykule przedstawiono krótki rys biograficzny Józefa Gołuchowskiego (1797-1858) do czasu wydalenia go z Wilna przez władze carskie. Omówiono sprawę jego nominacji oraz odwołania, a także okoliczności, które sprawiły, że nie było mu dane wygłoszenie mowy na uroczystości zakończenia roku akad. 1823/1824.

  • Simulation of electric hearing - influence of simulation parameters on quality of output signal

    Publikacja

    - Rok 2006

    W środowisku programistycznym Matlab stworzono symulację słuchu elektrycznego pacjenta implantowanego. W symulacji zastosowano algorytm przetwarzania wykorzystywany w komercyjnych systemach implantów ślimakowych - CIS (Continuous Interleaved Sampling). W pracy zbadano wpływ ilości kanałów, jak i innych parametrów sygnałów wyjściowych przy zastosowaniu sygału mowy jako sygnału wejściowego symulacji.

  • Diagnostyka słuchu i zagrożeń hałasowych

    Publikacja

    - Rok 2003

    W pierwszej części referatu przedstawiono przesiewową metodę diagnostyki słuchu. Szczegółowo opisano różne rodzaje testów przesiewowych. Zamieszczono dyskusję zastosowanej audiometrii mowy w słuchu. W drugiej części przedstawiono aktualnie opracowywany system zdalnego monitorowania zagrożeń hałasowych. Oprócz ogólnej charakterystyki systemu przedstawiono szczegółowy opis jego poszczególnych elementów składowych.

  • Miary jakości transmisji głosu w technologii VoIP.

    Publikacja

    Przedstawiono i omówiono czynniki decydujące o jakości mowy takie jak: opóźnienie tak charakterystyczne dla sieci IP a głównie jego fluktuacja, utraty pakietów podczas transmisji, rozmiar pakietu oraz zjawisko echa zbliżonego jadalnego. Jakość transmisji uzależniono od elementów występujących w łącznej sieci telekomunikacyjnej typu PSTN, bram oraz sieci IP.

  • Badanie dźwiękowego systemu ostrzegawczego w sali kinowej pod kątem zgodności z normą

    Publikacja

    - Rok 2003

    Elementem infrastruktury ewakuacyjnej obiektów użytku publicznego, zwłaszcza przeznaczonych dla imprez masowych, jest autonomiczny system akustyczny odpowiadający wymaganiom normy PN-EN 60849 "Dźwiękowe systemy ostrzegawcze". Referat przedstawia metodykę i wyniki pomiarów podstawowych parametrów akustycznych systemu "ewakuacji głosowej" zainstalowanego w sali typowego multikina, ze szczególnym uwzględnieniem parametrów określających...

  • ALOFON Metodyka i technologia polimodalnej alofonicznej transkrypcji mowy

    Projekty

    Kierownik projektu: prof. dr hab. inż. Andrzej Czyżewski   Program finansujący: OPUS

    Projekt realizowany w Katedra Systemów Multimedialnych zgodnie z porozumieniem UMO-2015/17/B/ST6/01874 z dnia 2016-02-19

  • Dwupunktowy estymator pulsacji chwilowej w zastosowaniu do estymacji tonu krtaniowego.

    Publikacja

    Przedstawiono algorytm do estymacji wartości tzw. tonu krtaniowego działający z wykorzystaniem banku zespolonych filtrów wąskopasmowych oraz dwupunktowego estymatora pulsacji chwilowej, który wykorzystuje tylko bieżącą próbkę i poprzednią. Bank zespolonych filtrów półoktawowych został specjalnie dobrany do właściwości analizowanego sygnału mowy i wymagań nieliniowego przetwarzania następującego po nim. W pracy zamieszczono wyniki...

  • Komputerowe modelowanie dźwiękowodu aparatu słuchowego

    Publikacja

    - Rok 2005

    W artykule opisano metodę komputerowego modelowania dźwiękowodu aparatu słuchowego. Model opracowany został z wykorzystaniem metody falowodowej. Symulacje komputerowe umożliwiają zbadanie właściwości akustycznych dźwiękowodów o różnych parametrach. Opisany model może zostać zastosowany w systemie dopasowywania aparatu słuchowego do potrzeb jego użytkownika, w celu zminimalizowania zniekształceń dźwięku wprowadzanych przez dźwiękowód...

  • Estymacja tonu krtaniowego w oparciu o zespoloną pulsację chwilową

    W niniejszej pracy zaproponowano nową metodę ekstrakcji tonu krtaniowego w oparciu o zespoloną pulsacjęchwilową - ICF (ang. Instantaneous Complex Frequency). Zaproponowano interaktywny algorytm analizy ICF sygnałumowy, którego wyniki udokumentowano zarówno w dziedzinie czasu (na płaszczyźnie Arganda) jak i w dziedzinieczęstotliwości. Na podstawie osiągniętych wyników wykazano bezpośredni, jednoznaczny związek pomiędzy okresemtonu...

  • Wpływ prędkości terminala i liczby częstotliwości nosnych na jakość odbioru w systemie GSM z hoppingiem częstotliwościowyn

    W pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na poprawę charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Charakterystyki te obrazują wpływ prędkości przemieszczania się terminala ruchomego oraz liczby częstotliwości nośnych wykorzystywanych w stacji bazowej do hoppingu na wartość Eb/N0, w różnych środowiskach propagacyjnych. Osiągana poprawa jakości jest szczególnie znacząca przy małych...

  • Audiovisual speech recognition for training hearing impaired patients

    Publikacja

    Praca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...

  • Zastosowanie inżynierii dźwięku i obrazu w medycynie

    Publikacja

    - Rok 2003

    Wynikiem opracowań Katedry Systemów Multimedialnych PG we współpracy z Instytutem Fizjologii i Patologii Słuchu w Warszawie jest zestaw narzędzi komputerowych do badania słuchu oraz rozwiązanie systemowe masowych badań przesiewowych słuchu, mowy i wzroku oparte na zastosowaniu współczesnych technologii teleinformatycznych. Niektóre wdrożone aplikacje i systemy z dziedziny diagnostyki słuchu, mające w znacznej mierze charakter oryginalny,...

  • Projekt systemu nagłośnieniowego z wykorzystaniem oprogramowania CATT-Acoustic.

    Publikacja

    - Rok 2004

    W niniejszej pracy zawarto projekt modelu akustycznego sali audytoryjnej oraz weryfikację charakterystyk pola akustycznego tego modelu w oparciu o program CATT-Acoustic. W pracy przedstawiono również projekt systemu nagłośnienia modelowanej sali audytoryjnej, który z punktu widzenia właściwości akustycznych powinien zapewnić jak najlepszą zrozumiałość mowy. Dokonano analizy porównawczej pola akustycznego bez oraz z zaimplementowanym...

  • Combining visual and acoustic modalities to ease speech recognition by hearing impaired people

    Publikacja

    - Rok 2005

    Artykuł prezentuje system, którego celem działania jest ułatwienie procesu treningu poprawnej wymowy dla osób z poważnymi wadami słuchu. W analizie mowy wykorzystane zostały parametry akutyczne i wizualne. Do wyznaczenia parametrów wizualnych na podstawie kształtu i ruchu ust zostały wykorzystane modele Active Shape Models. Parametry akustyczne bazują na współczynnikach melcepstralnych. Do klasyfikacji wypowiadanych głosek została...

  • Hearing aid operating in acoustical free field

    Publikacja

    Aparatowanie bardzo małych dzieci (od 5 miesiąca życia) za pomocą standardowych protez słuchu natrafia na wiele trudności natury praktycznej. Dotyczy to procesu dopasowania aparatu słuchowego, czyli doboru jego ustawień stosownie do aktualnych charakterystyk ubytku słuchu dzieci. Tymczasem wczesne aparatowanie jest zagadnieniem o ogromnym zanczeniu dla rozwoju słuchu, mowy i ogólnej inteligencji dziecka. Referat prezentuje uzyskane...

  • Speech recognition system for hearing impaired people.

    Publikacja

    - Rok 2005

    Praca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...

  • Telemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy

    Publikacja

    - Rok 2005

    Dzięki pomiarom odpowiedzi neuronalnych i możliwości wyznaczenia na tej podstawie tendencji rozkładu progów stymulacji można lepiej zaprogramować procesor mowy. Jest to niezwykle cenne zwłaszcza u pacjentów nie współpracujących podczas badań (na przykład u małych dzieci). W przypadku takich pacjentów tradycyjne, psychoakustyczne metody doboru parametrów stymulacji przez implant często zawodzą. Natomiast gdy audiolog dysponuje prawdopodobną...