Search results for: analiza mowy
-
Telemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy
PublicationDzięki pomiarom odpowiedzi neuronalnych i możliwości wyznaczenia na tej podstawie tendencji rozkładu progów stymulacji można lepiej zaprogramować procesor mowy. Jest to niezwykle cenne zwłaszcza u pacjentów nie współpracujących podczas badań (na przykład u małych dzieci). W przypadku takich pacjentów tradycyjne, psychoakustyczne metody doboru parametrów stymulacji przez implant często zawodzą. Natomiast gdy audiolog dysponuje prawdopodobną...
-
Speech recognition system for hearing impaired people.
PublicationPraca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...
-
PRZEGLĄD METOD PRZETWARZANIA DŹWIĘKU WYKORZYSTYWANYCH W APARATACH SŁUCHOWYCH
PublicationNiniejszy artykuł odnosi się do aktualnego stanu technologii wykorzystywanych w cyfrowych aparatach słuchowych, ze szczególnym uwzględnieniem technik cyfrowego przetwarzania sygnałów dźwiękowych. W artykule przedstawiono czynniki mające wpływ na efektywność aparatów słuchowych, a także zaprezentowano przykłady nowoczesnych metod cyfrowego przetwarzania sygnałów. Przedstawiono również przykłady ograniczeń współczesnych aparatów...
-
Internet-based automatic hearing assessment system
PublicationCelem referatu jest prezentacja systemu przesiewowego badania słuchu w oparciu o Internet. Wady słuchu stanowią jedną z najszybciej postępujących chorób we współczesnym społeczeństwie. W tym kontekście ważne staje się umożliwienie przeprowadzania masowych testów wykrywających ubytki słuchu. Przedstawiona aplikacja zawiera audiometryczny test tonalny, test ilustrowany dla dzieci oraz test rozumienia mowy w szumie. Po zakończeniu...
-
Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową
PublicationW pracy zaprezentowano oryginalny algorytm estymacji wysokości chwilowej dźwięku. Wykorzystuje on zespolone filtry cyfrowe Hilberta o różnej szerokości pasm przepustowych. W eksperymentach posłużono się filtami nacelowanymi na wyznaczanie częstotliwości krtaniowej (odwrotności okresu drgań strun głosowych) na podstawie zarejestrowanych samogłosek wypowiadanych głosem męskim, żeńskim i dziecięcym. W algorytmie zastosowano estymator...
-
Investigations of speech signal parameters with regard to articulation influences
PublicationW pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...
-
Finite automata for compact representation of tuple dictionaries.
PublicationOpisane zostaje uogólnienie struktury danych - słownika, zwane słownikiem n-tek. Słownik n-tek przedstawia odwzorowanie n-tek łańcuchów znaków na pewne wartości. Motywacją dla powstania tej struktury danych są praktyczne zastosowania w przetwarzaniu języka i mowy, w których obszerne słowniki n-tek używane są do przedstawiania modeli języka. Przedstawiona zostaje technika oszczędnej reprezentacji słowników n-tek. Ta technika...
-
Deep neural networks for data analysis
e-Learning CoursesThe aim of the course is to familiarize students with the methods of deep learning for advanced data analysis. Typical areas of application of these types of methods include: image classification, speech recognition and natural language understanding. Celem przedmiotu jest zapoznanie studentów z metodami głębokiego uczenia maszynowego na potrzeby zaawansowanej analizy danych. Do typowych obszarów zastosowań tego typu metod należą:...
-
Lokalizacja tekstu w obrazie
PublicationW naturalnym otoczeniu człowieka znajduje się duża ilość łatwo rozpoznawalnej informacji przedstawionej w postaci znaków graficznych i tekstu. Informacja taka jest bardzo przydatna w poruszaniu się w środowisku miejskim. Niestety, osoby z upośledzonymi funkcjami wzroku w sposób oczywisty pozbawione są możliwości korzystania z tego rodzaju przekazu. Istniejące na rynku systemy rozpoznawania tekstu (OCR) nie są niestety dostosowane...
-
Contactless Hearing Aid for Infants Employing Signal Processing Algorithms. [Bezkontaktowy aparat słuchowy dla niemowląt wykorzystujący algorytmy przetwarzania sygnału]
PublicationZaprojektowany bezkontaktowy aparat słuchowy umiejscawiany jest w łóżeczku niemowlęcia. Aparat składający się z matrycy 4 mikrofonów oraz prototypowej karty z procesorem DSP pracuje w polu swobodnym. Przetworzony sygnał mowy emitowany jest z wykorzystaniem miniaturowych głośników. Opracowane algorytmy pozwalają na elminację akustycznych sprzężeń zwrotnych, które mogą wystepować ze względu na niewielką odległość mikrofonów od głośników...
-
Applications of knowledge technologies to sound and vision engineering
PublicationSpecjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...
-
Przetwarzanie dźwięków i obrazów
e-Learning CoursesCyfrowy tor foniczny i wizyjny. Elementy grafiki komputerowej i jej przetwarzania. Zniekształcenia dźwięku i obrazu, ich przyczyny i podstawowe metody ograniczania. Przetwarzanie brzmienia i synteza dźwięku. Podstawowe metody przetwarzania obrazu wizyjnego. Kodowanie dźwięku w procesie zapisu. Filtracja cyfrowa i metody projektowania filtrów cyfrowych. Podstawowe metody przetwarzania obrazu wizyjnego. Specjalne metody przetwarzania...
-
Efficient handover scheme for Mobile IPv4 over IEEE 802.11 networks with IEEE 802.21 triggers.
PublicationEfektywność przełączania jest bardzo istotnym parametrem, decydującym o pracy sieci bezprzewodowych, realizujacych usługi multimedialne na wysokim poziomie jakości. Użytkownicy takich sieci oczekują ciągłej obsługi podczas procesu przemieszczania się. Okazuje się, że istotnym źródlem opóźnień są nieefektywne procedury przełączania w warstwach drugiej i trzeciej, wynikający częściowo z postulatu o separacji funkcji realizowanych...
-
Modelowanie i pomiary nagłośnienia audytorium
PublicationUwaga projektantów systemów nagłośnieniowych zogniskowana jest na tzw. akustyce pomieszczenia, w którym realizowany jest przekaz słowny. Zjawiska pogłosowe związane z geometrią sali audytoryjnej, wynikające z wielokrotnych odbić fali dźwiękowej uznawane są za dominujące. Artykuł podejmuje niedoceniany problem wpływu liczby i rozmieszczenia głośników w sali na jakość przekazu. Superpozycji sygnałów dochodzących do słuchacza z wielu...
-
Implementacja usług VoIP na platformie RIK
PublicationW pracy przedstawiono strukturę platformy RIK (Rozproszonej Infrastruktury Komunikacyjnej) instalowanej na Wydziale ETI PG. Omówiono wymagania dla infrastruktury sieciowej Wydziału ETI umożliwiającej realizacje aplikacji VoIP. Opisano implementacje telefonów IP i usług VoIP w środowisku sieciowym na WETI PG. Scharakteryzowano środowisko programistyczne dla aplikacji VoIP. Zaprezentowano zaimplementowane na Wydziale ETI PG usługi:...
-
Olek - uczeń z autyzmem w szkole integracyjnej
PublicationAutorami publikacji są rodzice dziecka, którzy podzielili się swoimi spostrzeżeniami z czteroletniej edukacji dziecka z autyzmem w szkole podstawowej, integracyjnej. We wstępie opisano diagnozę, przeprowadzone terapie, pobyt w przedszkolu i rozwój dziecka przed pójściem do szkoły. W drogiej części opisano pobyt dziecka w szkole integracyjnej w klasach 1-4, w szczególności przedstawiono zalety i wady tego typu placówki. Wśród zalet...
-
REJESTRACJA, PARAMETRYZACJA I KLASYFIKACJA ALOFONÓW Z WYKORZYSTANIEM BIMODALNOŚCI
PublicationPraca dotyczy rejestracji i parametryzacji alofonów w języku angielskim z wykorzystaniem dwóch modalności. W badaniach dokonano rejestracji wypowiedzi w języku angielskim mówców, których znajomość tego języka odpowiada poziomowi rodowitego mówcy. W kolejnym etapie wyodrębnione zostały alofony z nagrań fonicznych i odpowiadające im sygnały wizyjne. W procesie tworzenia wektorów cech wykorzystano odrębne systemy parametryzacji,...
-
ADMEDVOICE Adaptive intelligent speech processing system of medical personnel with the structuring of test results and support of therapeutic process
ProjectsProject realized in Department of Multimedia Systems according to INFOSTRATEG4/0003/2022 agreement from 2023-05-04
-
CPS w multimediach
PublicationW artykule omówiono działalność badawczą Katedry Systemów Multimedialnych (KSM) w tematach: CPS, technologii multimedialnych, technologii studyjnych i wizyjnych, w zastosowaniach metod soft-computingu w inżynierii dźwięku i obrazu, akustyki muzycznej, psychofizjologii słuchu i wytwarzania mowy, syntezy dźwięku i obrazu oraz akustyki architektonicznej, i techniki nagłaśniania. Przedstawiono wyniki naukowe Katedry - liczbę publikacji,...
-
System inteligentnej nawigacji sterowanej głosem
PublicationW pracy rozważa się zagadnienie wykorzystania inteligentnego systemu nawigowania oraz przeglądania serwisu Internetowego z wykorzystaniem głosu. Projekt, na podstawie przeglądu zagadnień, scala istniejące rozwiązania, które umożliwiają sterowanie portalem internetowym za pomocą głosu w języku angielskim. Użytkownik otrzymuje możliwość wydawania komend głosowych, a także zapytań odnośnie zawartości portalu. W odróżnieniu od wielu...
-
Facebook, YouTube, Instagram... jako arbitrzy prawdy. Deepfake – na szlaku dystopii i łasce korporacji
PublicationZidentyfikowano ich w 2019 roku w sieci blisko 15 tysięcy . Zwykle nie dotyczą polityki, choć to przede wszystkim w środowisku politycznym budzą strach i zwątpienie. Strach przed dewastacja resztek społecznego zaufania, jakimi politycy się cieszą, zwątpienie – bo zwalczanie ich przekracza polityczne możliwości władz ujmowanych w kartezjańskim podziale władzy. Deepfake – bo o nich mowa – są przełomową innowacją wyznaczającą...
-
Inteligentne Systemy Interaktywne
Research TeamsNaturalne interfejsy, umożliwiające inteligentną interakcję człowiek-maszyna z możliwością oddziaływania na możliwie wszystkie zmysły człowieka równocześnie i bez potrzeby jego wcześniejszego szkolenia w zakresie używania typowych urządzeń zewnętrznych komputera, w tym z wykorzystaniem metod automatycznego rozpoznawania i syntezy mowy, biometrii, proaktywnych (samo-wykonywalnych) dokumentów elektronicznych, rozpoznawania emocji...
-
System lokalizacji dla niewidomych, oparty na nawigacji satelitarnej i zliczeniowej
PublicationOpracowano, wykonano i przetestowano prototyp urządzenia nawigacyjnego dla osób niewidomych złożony z palmtopa, zawierającego mapę elektroniczną, odbiornika GPS, modułu czujników przyspieszenia i pola magnetycznego oraz klawiatury bezprzewodowej i syntezatora mowy, umożliwiający samodzielne poruszanie się po nieznanym terenie, w szczególności na terenie miasta. W urządzeniu tym zaimplementowano szereg algorytmów wyznaczania położenia...
-
Virtual hearing aid - multimedia tool for demonstrating hearing aid benefits
PublicationWiększość osób niedosłyszących nie jest świadoma wszystkich możliwości korekcji ubytku słuchu. Wykorzystując techniki multimedialne można stworzyć oprogramowanie, które znacznie ułatwi i przybliży proces dopasowania aparatów słuchowych. Celem przeprowadzonych eksperymentów było opracowanie multimedialnego systemu, który pozwala zrealizować następujące funkcje: - pomiar charakterystyki dynamiki słuchu, - wyznaczanie charakterystyki...
-
Zmiana szybkości próbkowania z użyciem filtru ułamkowoopóźniającego o zmiennej szerokości pasma
PublicationWspółcześnie w zapisie i przetwarzaniu sygnałów dominuje technika cyfrowa, która prawie całkowicie wyparła technikę analogową, między innymi ze względu na możliwość wierniejszego i trwalszego zapisu. Jednak poza swymi zaletami technika cyfrowa stwarza nowe problemy. Między innymi problem stanowi przenoszenie sygnałów cyfrowych pomiędzy systemami pracującymi z różnymi szybkościami próbkowania. Szczególnym wyzwaniem w tym zakresie...
-
Mówiące Mapy
PublicationW referacie zaprezentowana została koncepcja oraz wizja prototypu implementacji dedykowanego systemu informacji przestrzennej (GIS) wspierającego samodzielne poruszanie się i nawigację po terenie miejskim osób niewidomych. Po wprowadzeniu w zagadnienie, omówiono wykorzystanie bazy danych przestrzennych miejskiej sieci tras dostępnych dla osób pieszych, co umożliwia systemowi automatyczne znajdowanie optymalnej trasy z punktu...
-
New Applications of Multimodal Human-Computer Interfaces
PublicationMultimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...