Wyniki wyszukiwania dla: kodowanie sygnalu mowy

PRZEGLĄD METOD PRZETWARZANIA DŹWIĘKU WYKORZYSTYWANYCH W APARATACH SŁUCHOWYCH

Publikacja

- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2016

Niniejszy artykuł odnosi się do aktualnego stanu technologii wykorzystywanych w cyfrowych aparatach słuchowych, ze szczególnym uwzględnieniem technik cyfrowego przetwarzania sygnałów dźwiękowych. W artykule przedstawiono czynniki mające wpływ na efektywność aparatów słuchowych, a także zaprezentowano przykłady nowoczesnych metod cyfrowego przetwarzania sygnałów. Przedstawiono również przykłady ograniczeń współczesnych aparatów...

Pełny tekst do pobrania w portalu

Speech recognition system for hearing impaired people.

Publikacja

- Rok 2005

Praca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...

Telemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy

Publikacja

A. Walkowiak
A. Czyżewski

- Rok 2005

Dzięki pomiarom odpowiedzi neuronalnych i możliwości wyznaczenia na tej podstawie tendencji rozkładu progów stymulacji można lepiej zaprogramować procesor mowy. Jest to niezwykle cenne zwłaszcza u pacjentów nie współpracujących podczas badań (na przykład u małych dzieci). W przypadku takich pacjentów tradycyjne, psychoakustyczne metody doboru parametrów stymulacji przez implant często zawodzą. Natomiast gdy audiolog dysponuje prawdopodobną...

Internet-based automatic hearing assessment system

Publikacja

A. Czyżewski
B. Kostek
H. Skarzyński

- Rok 2005

Celem referatu jest prezentacja systemu przesiewowego badania słuchu w oparciu o Internet. Wady słuchu stanowią jedną z najszybciej postępujących chorób we współczesnym społeczeństwie. W tym kontekście ważne staje się umożliwienie przeprowadzania masowych testów wykrywających ubytki słuchu. Przedstawiona aplikacja zawiera audiometryczny test tonalny, test ilustrowany dla dzieci oraz test rozumienia mowy w szumie. Po zakończeniu...

Zastosowanie sieci neuronowych w cyfrowej syntezie dźwięku

Publikacja

- Rok 2018

Rozwój technik związanych z uczeniem maszynowym umożliwia nowe podejście i nowe definiowanie wielu dotychczasowych problemów. Heurystyczne algorytmy stosowane do problemów takich jak klasyfikacja danych w postaci wektorów cech, czy wyróżnianie grup obiektów o podobnych własnościach mogą znaleźć także zastosowanie w takich dziedzinach jak analiza i synteza dźwięków muzycznych. W referacie przybliżone zostały podstawowe zasady projektowania...

Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową

Publikacja

- Elektronika : konstrukcje, technologie, zastosowania - Rok 2011

W pracy zaprezentowano oryginalny algorytm estymacji wysokości chwilowej dźwięku. Wykorzystuje on zespolone filtry cyfrowe Hilberta o różnej szerokości pasm przepustowych. W eksperymentach posłużono się filtami nacelowanymi na wyznaczanie częstotliwości krtaniowej (odwrotności okresu drgań strun głosowych) na podstawie zarejestrowanych samogłosek wypowiadanych głosem męskim, żeńskim i dziecięcym. W algorytmie zastosowano estymator...

Investigations of speech signal parameters with regard to articulation influences

Publikacja

A. Kaczmarek

- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Rok 2008

W pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...

Finite automata for compact representation of tuple dictionaries.

Publikacja

J. Daciuk
V. N. Gertjan

- THEORETICAL COMPUTER SCIENCE - Rok 2004

Opisane zostaje uogólnienie struktury danych - słownika, zwane słownikiem n-tek. Słownik n-tek przedstawia odwzorowanie n-tek łańcuchów znaków na pewne wartości. Motywacją dla powstania tej struktury danych są praktyczne zastosowania w przetwarzaniu języka i mowy, w których obszerne słowniki n-tek używane są do przedstawiania modeli języka. Przedstawiona zostaje technika oszczędnej reprezentacji słowników n-tek. Ta technika...

Pełny tekst do pobrania w portalu

Contactless Hearing Aid for Infants Employing Signal Processing Algorithms. [Bezkontaktowy aparat słuchowy dla niemowląt wykorzystujący algorytmy przetwarzania sygnału]

Publikacja

- Rok 2006

Zaprojektowany bezkontaktowy aparat słuchowy umiejscawiany jest w łóżeczku niemowlęcia. Aparat składający się z matrycy 4 mikrofonów oraz prototypowej karty z procesorem DSP pracuje w polu swobodnym. Przetworzony sygnał mowy emitowany jest z wykorzystaniem miniaturowych głośników. Opracowane algorytmy pozwalają na elminację akustycznych sprzężeń zwrotnych, które mogą wystepować ze względu na niewielką odległość mikrofonów od głośników...

Applications of knowledge technologies to sound and vision engineering

Publikacja

A. Czyżewski

- Rok 2006

Specjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...

Lokalizacja tekstu w obrazie

Publikacja

M. Pazio

- Measurement Automation Monitoring - Rok 2008

W naturalnym otoczeniu człowieka znajduje się duża ilość łatwo rozpoznawalnej informacji przedstawionej w postaci znaków graficznych i tekstu. Informacja taka jest bardzo przydatna w poruszaniu się w środowisku miejskim. Niestety, osoby z upośledzonymi funkcjami wzroku w sposób oczywisty pozbawione są możliwości korzystania z tego rodzaju przekazu. Istniejące na rynku systemy rozpoznawania tekstu (OCR) nie są niestety dostosowane...

REJESTRACJA, PARAMETRYZACJA I KLASYFIKACJA ALOFONÓW Z WYKORZYSTANIEM BIMODALNOŚCI

Publikacja

- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2018

Praca dotyczy rejestracji i parametryzacji alofonów w języku angielskim z wykorzystaniem dwóch modalności. W badaniach dokonano rejestracji wypowiedzi w języku angielskim mówców, których znajomość tego języka odpowiada poziomowi rodowitego mówcy. W kolejnym etapie wyodrębnione zostały alofony z nagrań fonicznych i odpowiadające im sygnały wizyjne. W procesie tworzenia wektorów cech wykorzystano odrębne systemy parametryzacji,...

Pełny tekst do pobrania w portalu

Rejestracja i analiza kontekstu emocjonalnego człowieka w przetwarzaniu wszechobecnym

Publikacja

A. Bońkowski

- Rok 2009

Systemy przetwarzania wszechobecnego tworzące inteligentneśrodowisko podejmują działania na podstawie zebranych informacji nazywanych kontekstem. Umiejętność rozpoznawania ludzkich emocji, jako przejaw wyższej inteligencji, jest ich pożądaną cechą. Istnieje kilka modeli doznań emocjonalnych, które mogą stać się podstawą do budowy uniwersalnego systemu rozpoznającego emocje, bazującego na ekstrakcji cech z danych wejściowych i klasyfkacji...

Modelowanie i pomiary nagłośnienia audytorium

Publikacja

- Measurement Automation Monitoring - Rok 2008

Uwaga projektantów systemów nagłośnieniowych zogniskowana jest na tzw. akustyce pomieszczenia, w którym realizowany jest przekaz słowny. Zjawiska pogłosowe związane z geometrią sali audytoryjnej, wynikające z wielokrotnych odbić fali dźwiękowej uznawane są za dominujące. Artykuł podejmuje niedoceniany problem wpływu liczby i rozmieszczenia głośników w sali na jakość przekazu. Superpozycji sygnałów dochodzących do słuchacza z wielu...

Efficient handover scheme for Mobile IPv4 over IEEE 802.11 networks with IEEE 802.21 triggers.

Publikacja

- Rok 2008

Efektywność przełączania jest bardzo istotnym parametrem, decydującym o pracy sieci bezprzewodowych, realizujacych usługi multimedialne na wysokim poziomie jakości. Użytkownicy takich sieci oczekują ciągłej obsługi podczas procesu przemieszczania się. Okazuje się, że istotnym źródlem opóźnień są nieefektywne procedury przełączania w warstwach drugiej i trzeciej, wynikający częściowo z postulatu o separacji funkcji realizowanych...

Implementacja usług VoIP na platformie RIK

Publikacja

- Rok 2009

W pracy przedstawiono strukturę platformy RIK (Rozproszonej Infrastruktury Komunikacyjnej) instalowanej na Wydziale ETI PG. Omówiono wymagania dla infrastruktury sieciowej Wydziału ETI umożliwiającej realizacje aplikacji VoIP. Opisano implementacje telefonów IP i usług VoIP w środowisku sieciowym na WETI PG. Scharakteryzowano środowisko programistyczne dla aplikacji VoIP. Zaprezentowano zaimplementowane na Wydziale ETI PG usługi:...

Olek - uczeń z autyzmem w szkole integracyjnej

Publikacja

R. Bray
R. T. Bray

- Autyzm - Rok 2014

Autorami publikacji są rodzice dziecka, którzy podzielili się swoimi spostrzeżeniami z czteroletniej edukacji dziecka z autyzmem w szkole podstawowej, integracyjnej. We wstępie opisano diagnozę, przeprowadzone terapie, pobyt w przedszkolu i rozwój dziecka przed pójściem do szkoły. W drogiej części opisano pobyt dziecka w szkole integracyjnej w klasach 1-4, w szczególności przedstawiono zalety i wady tego typu placówki. Wśród zalet...

CPS w multimediach

Publikacja

E. Hermanowicz

- Rok 2010

W artykule omówiono działalność badawczą Katedry Systemów Multimedialnych (KSM) w tematach: CPS, technologii multimedialnych, technologii studyjnych i wizyjnych, w zastosowaniach metod soft-computingu w inżynierii dźwięku i obrazu, akustyki muzycznej, psychofizjologii słuchu i wytwarzania mowy, syntezy dźwięku i obrazu oraz akustyki architektonicznej, i techniki nagłaśniania. Przedstawiono wyniki naukowe Katedry - liczbę publikacji,...

Pełny tekst do pobrania w serwisie zewnętrznym

The data exchange between smart glasses and healthcare information systems using the HL7 FHIR standard

Publikacja

J. Rumiński
A. Bujnowski
T. Kocejko
A. Andrushevich
M. Biallas
R. Kistler

- Rok 2016

In this study we evaluated system architecture for the use of smart glasses as a viewer of information, as a source of medical data (vital sign measurements: temperature, pulse rate, and respiration rate), and as a filter of healthcare information. All activities were based on patient/device identification procedures using graphical markers or features based on visual appearance. The architecture and particular use cases were implemented...

Pełny tekst do pobrania w serwisie zewnętrznym

System inteligentnej nawigacji sterowanej głosem

Publikacja

- Measurement Automation Monitoring - Rok 2013

W pracy rozważa się zagadnienie wykorzystania inteligentnego systemu nawigowania oraz przeglądania serwisu Internetowego z wykorzystaniem głosu. Projekt, na podstawie przeglądu zagadnień, scala istniejące rozwiązania, które umożliwiają sterowanie portalem internetowym za pomocą głosu w języku angielskim. Użytkownik otrzymuje możliwość wydawania komend głosowych, a także zapytań odnośnie zawartości portalu. W odróżnieniu od wielu...

Facebook, YouTube, Instagram... jako arbitrzy prawdy. Deepfake – na szlaku dystopii i łasce korporacji

Publikacja

J. Kreft

- Rok 2020

Zidentyfikowano ich w 2019 roku w sieci blisko 15 tysięcy . Zwykle nie dotyczą polityki, choć to przede wszystkim w środowisku politycznym budzą strach i zwątpienie. Strach przed dewastacja resztek społecznego zaufania, jakimi politycy się cieszą, zwątpienie – bo zwalczanie ich przekracza polityczne możliwości władz ujmowanych w kartezjańskim podziale władzy. Deepfake – bo o nich mowa – są przełomową innowacją wyznaczającą...

System lokalizacji dla niewidomych, oparty na nawigacji satelitarnej i zliczeniowej

Publikacja

S. Ceranka

- Rok 2007

Opracowano, wykonano i przetestowano prototyp urządzenia nawigacyjnego dla osób niewidomych złożony z palmtopa, zawierającego mapę elektroniczną, odbiornika GPS, modułu czujników przyspieszenia i pola magnetycznego oraz klawiatury bezprzewodowej i syntezatora mowy, umożliwiający samodzielne poruszanie się po nieznanym terenie, w szczególności na terenie miasta. W urządzeniu tym zaimplementowano szereg algorytmów wyznaczania położenia...

Virtual hearing aid - multimedia tool for demonstrating hearing aid benefits

Publikacja

- Rok 2005

Większość osób niedosłyszących nie jest świadoma wszystkich możliwości korekcji ubytku słuchu. Wykorzystując techniki multimedialne można stworzyć oprogramowanie, które znacznie ułatwi i przybliży proces dopasowania aparatów słuchowych. Celem przeprowadzonych eksperymentów było opracowanie multimedialnego systemu, który pozwala zrealizować następujące funkcje: - pomiar charakterystyki dynamiki słuchu, - wyznaczanie charakterystyki...

Zmiana szybkości próbkowania z użyciem filtru ułamkowoopóźniającego o zmiennej szerokości pasma

Publikacja

M. Blok

- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Rok 2016

Współcześnie w zapisie i przetwarzaniu sygnałów dominuje technika cyfrowa, która prawie całkowicie wyparła technikę analogową, między innymi ze względu na możliwość wierniejszego i trwalszego zapisu. Jednak poza swymi zaletami technika cyfrowa stwarza nowe problemy. Między innymi problem stanowi przenoszenie sygnałów cyfrowych pomiędzy systemami pracującymi z różnymi szybkościami próbkowania. Szczególnym wyzwaniem w tym zakresie...

Pełny tekst do pobrania w serwisie zewnętrznym

Mówiące Mapy

Publikacja

- Rok 2010

W referacie zaprezentowana została koncepcja oraz wizja prototypu implementacji dedykowanego systemu informacji przestrzennej (GIS) wspierającego samodzielne poruszanie się i nawigację po terenie miejskim osób niewidomych. Po wprowadzeniu w zagadnienie, omówiono wykorzystanie bazy danych przestrzennych miejskiej sieci tras dostępnych dla osób pieszych, co umożliwia systemowi automatyczne znajdowanie optymalnej trasy z punktu...

Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych

Publikacja

M. Ciołek

- Rok 2017

Wniniejszej pracy doktorskiej opisano nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone...

Pełny tekst do pobrania w portalu

Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie

Publikacja

T. Poremski
P. Szymański
B. Kostek

- Otorynolaryngologia - Przegląd Kliniczny - Rok 2018

W opracowaniu dokonano przeglądu dostępnych prac dotyczących różnych rodzajów urządzeń poprawiających słyszenie, które w szczególnych przypadkach mogą być traktowane jako rozwiązania alternatywne w stosunku do klasycznych aparatów słuchowych. Praca zawiera dyskusję na temat nowego rodzaju aparatu słuchowego wstępnie zaprogramowanego, który może być dystrybuowany korespondencyjnie lub bezpośrednio potencjalnym użytkownikom. Ponadto...

Pełny tekst do pobrania w serwisie zewnętrznym

New Applications of Multimodal Human-Computer Interfaces

Publikacja

A. Czyżewski

- Rok 2012

Multimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...

Filtry

Katalog

Kategoria

Rok

Opcje

PRZEGLĄD METOD PRZETWARZANIA DŹWIĘKU WYKORZYSTYWANYCH W APARATACH SŁUCHOWYCH

Speech recognition system for hearing impaired people.

Telemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy

Internet-based automatic hearing assessment system

Zastosowanie sieci neuronowych w cyfrowej syntezie dźwięku

Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową

Investigations of speech signal parameters with regard to articulation influences

Finite automata for compact representation of tuple dictionaries.

Contactless Hearing Aid for Infants Employing Signal Processing Algorithms. [Bezkontaktowy aparat słuchowy dla niemowląt wykorzystujący algorytmy przetwarzania sygnału]

Applications of knowledge technologies to sound and vision engineering

Lokalizacja tekstu w obrazie

REJESTRACJA, PARAMETRYZACJA I KLASYFIKACJA ALOFONÓW Z WYKORZYSTANIEM BIMODALNOŚCI

Rejestracja i analiza kontekstu emocjonalnego człowieka w przetwarzaniu wszechobecnym

Modelowanie i pomiary nagłośnienia audytorium

Efficient handover scheme for Mobile IPv4 over IEEE 802.11 networks with IEEE 802.21 triggers.

Implementacja usług VoIP na platformie RIK

Olek - uczeń z autyzmem w szkole integracyjnej

CPS w multimediach

The data exchange between smart glasses and healthcare information systems using the HL7 FHIR standard

System inteligentnej nawigacji sterowanej głosem

Facebook, YouTube, Instagram... jako arbitrzy prawdy. Deepfake – na szlaku dystopii i łasce korporacji

System lokalizacji dla niewidomych, oparty na nawigacji satelitarnej i zliczeniowej

Virtual hearing aid - multimedia tool for demonstrating hearing aid benefits

Zmiana szybkości próbkowania z użyciem filtru ułamkowoopóźniającego o zmiennej szerokości pasma

Mówiące Mapy

Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych

Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie

New Applications of Multimodal Human-Computer Interfaces

Wyszukiwarka

Filtry

Katalog

Kategoria

Rok

Opcje

Wyniki wyszukiwania dla: kodowanie sygnalu mowy