Wyniki wyszukiwania dla: kodowanie sygnalu mowy - MOST Wiedzy

Wyszukiwarka

Wyniki wyszukiwania dla: kodowanie sygnalu mowy

Filtry

wszystkich: 177
wybranych: 128

wyczyść wszystkie filtry


Filtry wybranego katalogu

  • Kategoria

  • Rok

  • Opcje

wyczyść Filtry wybranego katalogu niedostępne

Wyniki wyszukiwania dla: kodowanie sygnalu mowy

  • PRZEGLĄD METOD PRZETWARZANIA DŹWIĘKU WYKORZYSTYWANYCH W APARATACH SŁUCHOWYCH

    Niniejszy artykuł odnosi się do aktualnego stanu technologii wykorzystywanych w cyfrowych aparatach słuchowych, ze szczególnym uwzględnieniem technik cyfrowego przetwarzania sygnałów dźwiękowych. W artykule przedstawiono czynniki mające wpływ na efektywność aparatów słuchowych, a także zaprezentowano przykłady nowoczesnych metod cyfrowego przetwarzania sygnałów. Przedstawiono również przykłady ograniczeń współczesnych aparatów...

    Pełny tekst do pobrania w portalu

  • Speech recognition system for hearing impaired people.

    Publikacja

    - Rok 2005

    Praca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...

  • Telemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy

    Publikacja

    - Rok 2005

    Dzięki pomiarom odpowiedzi neuronalnych i możliwości wyznaczenia na tej podstawie tendencji rozkładu progów stymulacji można lepiej zaprogramować procesor mowy. Jest to niezwykle cenne zwłaszcza u pacjentów nie współpracujących podczas badań (na przykład u małych dzieci). W przypadku takich pacjentów tradycyjne, psychoakustyczne metody doboru parametrów stymulacji przez implant często zawodzą. Natomiast gdy audiolog dysponuje prawdopodobną...

  • Internet-based automatic hearing assessment system

    Publikacja

    - Rok 2005

    Celem referatu jest prezentacja systemu przesiewowego badania słuchu w oparciu o Internet. Wady słuchu stanowią jedną z najszybciej postępujących chorób we współczesnym społeczeństwie. W tym kontekście ważne staje się umożliwienie przeprowadzania masowych testów wykrywających ubytki słuchu. Przedstawiona aplikacja zawiera audiometryczny test tonalny, test ilustrowany dla dzieci oraz test rozumienia mowy w szumie. Po zakończeniu...

  • Zastosowanie sieci neuronowych w cyfrowej syntezie dźwięku

    Publikacja

    Rozwój technik związanych z uczeniem maszynowym umożliwia nowe podejście i nowe definiowanie wielu dotychczasowych problemów. Heurystyczne algorytmy stosowane do problemów takich jak klasyfikacja danych w postaci wektorów cech, czy wyróżnianie grup obiektów o podobnych własnościach mogą znaleźć także zastosowanie w takich dziedzinach jak analiza i synteza dźwięków muzycznych. W referacie przybliżone zostały podstawowe zasady projektowania...

  • Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową

    W pracy zaprezentowano oryginalny algorytm estymacji wysokości chwilowej dźwięku. Wykorzystuje on zespolone filtry cyfrowe Hilberta o różnej szerokości pasm przepustowych. W eksperymentach posłużono się filtami nacelowanymi na wyznaczanie częstotliwości krtaniowej (odwrotności okresu drgań strun głosowych) na podstawie zarejestrowanych samogłosek wypowiadanych głosem męskim, żeńskim i dziecięcym. W algorytmie zastosowano estymator...

  • Investigations of speech signal parameters with regard to articulation influences

    W pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...

  • Finite automata for compact representation of tuple dictionaries.

    Publikacja

    - THEORETICAL COMPUTER SCIENCE - Rok 2004

    Opisane zostaje uogólnienie struktury danych - słownika, zwane słownikiem n-tek. Słownik n-tek przedstawia odwzorowanie n-tek łańcuchów znaków na pewne wartości. Motywacją dla powstania tej struktury danych są praktyczne zastosowania w przetwarzaniu języka i mowy, w których obszerne słowniki n-tek używane są do przedstawiania modeli języka. Przedstawiona zostaje technika oszczędnej reprezentacji słowników n-tek. Ta technika...

    Pełny tekst do pobrania w portalu

  • Contactless Hearing Aid for Infants Employing Signal Processing Algorithms. [Bezkontaktowy aparat słuchowy dla niemowląt wykorzystujący algorytmy przetwarzania sygnału]

    Publikacja

    Zaprojektowany bezkontaktowy aparat słuchowy umiejscawiany jest w łóżeczku niemowlęcia. Aparat składający się z matrycy 4 mikrofonów oraz prototypowej karty z procesorem DSP pracuje w polu swobodnym. Przetworzony sygnał mowy emitowany jest z wykorzystaniem miniaturowych głośników. Opracowane algorytmy pozwalają na elminację akustycznych sprzężeń zwrotnych, które mogą wystepować ze względu na niewielką odległość mikrofonów od głośników...

  • Applications of knowledge technologies to sound and vision engineering

    Publikacja

    - Rok 2006

    Specjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...

  • Lokalizacja tekstu w obrazie

    W naturalnym otoczeniu człowieka znajduje się duża ilość łatwo rozpoznawalnej informacji przedstawionej w postaci znaków graficznych i tekstu. Informacja taka jest bardzo przydatna w poruszaniu się w środowisku miejskim. Niestety, osoby z upośledzonymi funkcjami wzroku w sposób oczywisty pozbawione są możliwości korzystania z tego rodzaju przekazu. Istniejące na rynku systemy rozpoznawania tekstu (OCR) nie są niestety dostosowane...

  • REJESTRACJA, PARAMETRYZACJA I KLASYFIKACJA ALOFONÓW Z WYKORZYSTANIEM BIMODALNOŚCI

    Praca dotyczy rejestracji i parametryzacji alofonów w języku angielskim z wykorzystaniem dwóch modalności. W badaniach dokonano rejestracji wypowiedzi w języku angielskim mówców, których znajomość tego języka odpowiada poziomowi rodowitego mówcy. W kolejnym etapie wyodrębnione zostały alofony z nagrań fonicznych i odpowiadające im sygnały wizyjne. W procesie tworzenia wektorów cech wykorzystano odrębne systemy parametryzacji,...

    Pełny tekst do pobrania w portalu

  • Rejestracja i analiza kontekstu emocjonalnego człowieka w przetwarzaniu wszechobecnym

    Publikacja

    - Rok 2009

    Systemy przetwarzania wszechobecnego tworzące inteligentneśrodowisko podejmują działania na podstawie zebranych informacji nazywanych kontekstem. Umiejętność rozpoznawania ludzkich emocji, jako przejaw wyższej inteligencji, jest ich pożądaną cechą. Istnieje kilka modeli doznań emocjonalnych, które mogą stać się podstawą do budowy uniwersalnego systemu rozpoznającego emocje, bazującego na ekstrakcji cech z danych wejściowych i klasyfkacji...

  • Modelowanie i pomiary nagłośnienia audytorium

    Uwaga projektantów systemów nagłośnieniowych zogniskowana jest na tzw. akustyce pomieszczenia, w którym realizowany jest przekaz słowny. Zjawiska pogłosowe związane z geometrią sali audytoryjnej, wynikające z wielokrotnych odbić fali dźwiękowej uznawane są za dominujące. Artykuł podejmuje niedoceniany problem wpływu liczby i rozmieszczenia głośników w sali na jakość przekazu. Superpozycji sygnałów dochodzących do słuchacza z wielu...

  • Efficient handover scheme for Mobile IPv4 over IEEE 802.11 networks with IEEE 802.21 triggers.

    Publikacja

    - Rok 2008

    Efektywność przełączania jest bardzo istotnym parametrem, decydującym o pracy sieci bezprzewodowych, realizujacych usługi multimedialne na wysokim poziomie jakości. Użytkownicy takich sieci oczekują ciągłej obsługi podczas procesu przemieszczania się. Okazuje się, że istotnym źródlem opóźnień są nieefektywne procedury przełączania w warstwach drugiej i trzeciej, wynikający częściowo z postulatu o separacji funkcji realizowanych...

  • Implementacja usług VoIP na platformie RIK

    Publikacja

    W pracy przedstawiono strukturę platformy RIK (Rozproszonej Infrastruktury Komunikacyjnej) instalowanej na Wydziale ETI PG. Omówiono wymagania dla infrastruktury sieciowej Wydziału ETI umożliwiającej realizacje aplikacji VoIP. Opisano implementacje telefonów IP i usług VoIP w środowisku sieciowym na WETI PG. Scharakteryzowano środowisko programistyczne dla aplikacji VoIP. Zaprezentowano zaimplementowane na Wydziale ETI PG usługi:...

  • Olek - uczeń z autyzmem w szkole integracyjnej

    Publikacja

    - Autyzm - Rok 2014

    Autorami publikacji są rodzice dziecka, którzy podzielili się swoimi spostrzeżeniami z czteroletniej edukacji dziecka z autyzmem w szkole podstawowej, integracyjnej. We wstępie opisano diagnozę, przeprowadzone terapie, pobyt w przedszkolu i rozwój dziecka przed pójściem do szkoły. W drogiej części opisano pobyt dziecka w szkole integracyjnej w klasach 1-4, w szczególności przedstawiono zalety i wady tego typu placówki. Wśród zalet...

  • CPS w multimediach

    Publikacja

    - Rok 2010

    W artykule omówiono działalność badawczą Katedry Systemów Multimedialnych (KSM) w tematach: CPS, technologii multimedialnych, technologii studyjnych i wizyjnych, w zastosowaniach metod soft-computingu w inżynierii dźwięku i obrazu, akustyki muzycznej, psychofizjologii słuchu i wytwarzania mowy, syntezy dźwięku i obrazu oraz akustyki architektonicznej, i techniki nagłaśniania. Przedstawiono wyniki naukowe Katedry - liczbę publikacji,...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • The data exchange between smart glasses and healthcare information systems using the HL7 FHIR standard

    Publikacja

    - Rok 2016

    In this study we evaluated system architecture for the use of smart glasses as a viewer of information, as a source of medical data (vital sign measurements: temperature, pulse rate, and respiration rate), and as a filter of healthcare information. All activities were based on patient/device identification procedures using graphical markers or features based on visual appearance. The architecture and particular use cases were implemented...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • System inteligentnej nawigacji sterowanej głosem

    W pracy rozważa się zagadnienie wykorzystania inteligentnego systemu nawigowania oraz przeglądania serwisu Internetowego z wykorzystaniem głosu. Projekt, na podstawie przeglądu zagadnień, scala istniejące rozwiązania, które umożliwiają sterowanie portalem internetowym za pomocą głosu w języku angielskim. Użytkownik otrzymuje możliwość wydawania komend głosowych, a także zapytań odnośnie zawartości portalu. W odróżnieniu od wielu...

  • Facebook, YouTube, Instagram... jako arbitrzy prawdy. Deepfake – na szlaku dystopii i łasce korporacji

    Publikacja

    - Rok 2020

    Zidentyfikowano ich w 2019 roku w sieci blisko 15 tysięcy . Zwykle nie dotyczą polityki, choć to przede wszystkim w środowisku politycznym budzą strach i zwątpienie. Strach przed dewastacja resztek społecznego zaufania, jakimi politycy się cieszą, zwątpienie – bo zwalczanie ich przekracza polityczne możliwości władz ujmowanych w kartezjańskim podziale władzy. Deepfake – bo o nich mowa – są przełomową innowacją wyznaczającą...

  • System lokalizacji dla niewidomych, oparty na nawigacji satelitarnej i zliczeniowej

    Publikacja
    • S. Ceranka

    - Rok 2007

    Opracowano, wykonano i przetestowano prototyp urządzenia nawigacyjnego dla osób niewidomych złożony z palmtopa, zawierającego mapę elektroniczną, odbiornika GPS, modułu czujników przyspieszenia i pola magnetycznego oraz klawiatury bezprzewodowej i syntezatora mowy, umożliwiający samodzielne poruszanie się po nieznanym terenie, w szczególności na terenie miasta. W urządzeniu tym zaimplementowano szereg algorytmów wyznaczania położenia...

  • Virtual hearing aid - multimedia tool for demonstrating hearing aid benefits

    Publikacja

    - Rok 2005

    Większość osób niedosłyszących nie jest świadoma wszystkich możliwości korekcji ubytku słuchu. Wykorzystując techniki multimedialne można stworzyć oprogramowanie, które znacznie ułatwi i przybliży proces dopasowania aparatów słuchowych. Celem przeprowadzonych eksperymentów było opracowanie multimedialnego systemu, który pozwala zrealizować następujące funkcje: - pomiar charakterystyki dynamiki słuchu, - wyznaczanie charakterystyki...

  • Zmiana szybkości próbkowania z użyciem filtru ułamkowoopóźniającego o zmiennej szerokości pasma

    Współcześnie w zapisie i przetwarzaniu sygnałów dominuje technika cyfrowa, która prawie całkowicie wyparła technikę analogową, między innymi ze względu na możliwość wierniejszego i trwalszego zapisu. Jednak poza swymi zaletami technika cyfrowa stwarza nowe problemy. Między innymi problem stanowi przenoszenie sygnałów cyfrowych pomiędzy systemami pracującymi z różnymi szybkościami próbkowania. Szczególnym wyzwaniem w tym zakresie...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Mówiące Mapy

    Publikacja

    - Rok 2010

    W referacie zaprezentowana została koncepcja oraz wizja prototypu implementacji dedykowanego systemu informacji przestrzennej (GIS) wspierającego samodzielne poruszanie się i nawigację po terenie miejskim osób niewidomych. Po wprowadzeniu w zagadnienie, omówiono wykorzystanie bazy danych przestrzennych miejskiej sieci tras dostępnych dla osób pieszych, co umożliwia systemowi automatyczne znajdowanie optymalnej trasy z punktu...

  • Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych

    Publikacja

    - Rok 2017

    Wniniejszej pracy doktorskiej opisano nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone...

    Pełny tekst do pobrania w portalu

  • Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie

    Publikacja

    - Otorynolaryngologia - Przegląd Kliniczny - Rok 2018

    W opracowaniu dokonano przeglądu dostępnych prac dotyczących różnych rodzajów urządzeń poprawiających słyszenie, które w szczególnych przypadkach mogą być traktowane jako rozwiązania alternatywne w stosunku do klasycznych aparatów słuchowych. Praca zawiera dyskusję na temat nowego rodzaju aparatu słuchowego wstępnie zaprogramowanego, który może być dystrybuowany korespondencyjnie lub bezpośrednio potencjalnym użytkownikom. Ponadto...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • New Applications of Multimodal Human-Computer Interfaces

    Publikacja

    - Rok 2012

    Multimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...