Wyniki wyszukiwania dla: transmisja sygnalow mowy - MOST Wiedzy

Wyszukiwarka

Wyniki wyszukiwania dla: transmisja sygnalow mowy

Filtry

wszystkich: 227
wybranych: 137

wyczyść wszystkie filtry


Filtry wybranego katalogu

  • Kategoria

  • Rok

  • Opcje

wyczyść Filtry wybranego katalogu niedostępne

Wyniki wyszukiwania dla: transmisja sygnalow mowy

  • Reprezentatywne dla danego języka spektra odpowiedzi impulsowej kanału głosowego = English language specific spectrum generated in the human vocal tract

    Publikacja

    - Rok 2005

    W pracy omówiono wybrane problemy ekstrakcji kodu informacji zawartego w dźwiękach mowy etnicznej. Autorzy, wykorzystując kompilację własnych i firmowych algorytmów, wydzielają w procesie wygładzania cepstralnego z cyfrowego zapisu dźwięków mowy naturalnej strukturę spektralną pobudzenia tonem krtaniowym i szumem oraz strukturę spektralną kanału głosowego modulującego to pobudzenie. W następnym kroku powstają -statystycznie reprezentatywne...

  • Detekcja zakłóceń impulsowych w sygnałach fonicznych.

    Publikacja

    - Rok 2003

    Artykuł poświęcony jest omówieniu problematyki związanej z wykrywaniem zakłóceń impulsowych występujących w sygnałach fonicznych. Proces detekcji zniekształconych próbek sygnału fonicznego jest etapem poprzedzającym ich rekonstrukcję. Polega ona na odtworzeniu nieznanych wartości próbek w oparciu o znane fragmenty sygnału. W pracy omówiono różne rodzaje zakłóceń impulsowych typowe dla archiwalnych i współczesnych sygnałów...

  • Zastosowanie inżynierii dźwięku i obrazu w medycynie

    Publikacja

    - Rok 2003

    Wynikiem opracowań Katedry Systemów Multimedialnych PG we współpracy z Instytutem Fizjologii i Patologii Słuchu w Warszawie jest zestaw narzędzi komputerowych do badania słuchu oraz rozwiązanie systemowe masowych badań przesiewowych słuchu, mowy i wzroku oparte na zastosowaniu współczesnych technologii teleinformatycznych. Niektóre wdrożone aplikacje i systemy z dziedziny diagnostyki słuchu, mające w znacznej mierze charakter oryginalny,...

  • Wpływ prędkości terminala i liczby częstotliwości nosnych na jakość odbioru w systemie GSM z hoppingiem częstotliwościowyn

    W pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na poprawę charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Charakterystyki te obrazują wpływ prędkości przemieszczania się terminala ruchomego oraz liczby częstotliwości nośnych wykorzystywanych w stacji bazowej do hoppingu na wartość Eb/N0, w różnych środowiskach propagacyjnych. Osiągana poprawa jakości jest szczególnie znacząca przy małych...

  • Projekt systemu nagłośnieniowego z wykorzystaniem oprogramowania CATT-Acoustic.

    Publikacja

    - Rok 2004

    W niniejszej pracy zawarto projekt modelu akustycznego sali audytoryjnej oraz weryfikację charakterystyk pola akustycznego tego modelu w oparciu o program CATT-Acoustic. W pracy przedstawiono również projekt systemu nagłośnienia modelowanej sali audytoryjnej, który z punktu widzenia właściwości akustycznych powinien zapewnić jak najlepszą zrozumiałość mowy. Dokonano analizy porównawczej pola akustycznego bez oraz z zaimplementowanym...

  • Combining visual and acoustic modalities to ease speech recognition by hearing impaired people

    Publikacja

    - Rok 2005

    Artykuł prezentuje system, którego celem działania jest ułatwienie procesu treningu poprawnej wymowy dla osób z poważnymi wadami słuchu. W analizie mowy wykorzystane zostały parametry akutyczne i wizualne. Do wyznaczenia parametrów wizualnych na podstawie kształtu i ruchu ust zostały wykorzystane modele Active Shape Models. Parametry akustyczne bazują na współczynnikach melcepstralnych. Do klasyfikacji wypowiadanych głosek została...

  • Hearing aid operating in acoustical free field

    Publikacja

    Aparatowanie bardzo małych dzieci (od 5 miesiąca życia) za pomocą standardowych protez słuchu natrafia na wiele trudności natury praktycznej. Dotyczy to procesu dopasowania aparatu słuchowego, czyli doboru jego ustawień stosownie do aktualnych charakterystyk ubytku słuchu dzieci. Tymczasem wczesne aparatowanie jest zagadnieniem o ogromnym zanczeniu dla rozwoju słuchu, mowy i ogólnej inteligencji dziecka. Referat prezentuje uzyskane...

  • Postępy w rozwoju standardu IEEE 802.11 i jego zastosowań Część II: Nowe obszary zastosowań i nowe koncepcje pracy sieci WiFi

    Artykuł stanowi kontynuację rozważań, podjętych w zeszycie nr 11 z 2016 r. PTiWT [1], na temat rozwoju standardu łEEE 802.11 , ukierunkowanego na zwiększanie szybkości przekazu i przekraczanie gigabitowej granicy przepływności łącza. Wskazano tam na modyfikacje i nowe mechanizmy implementowane w warstwie fizycznej i podwarstwie MAC standardów IEEE 802.11 n, IEEE 802.11 ac oraz IEEE 802.11 ad, mające istotny wpływ zarówno na wzrost...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Sterowanie kamerami i wizualizacja danych radarowych w rozproszonym systemie dyspozytorskim STRADAR dla straży granicznej

    STRADAR to rozproszony system danych multimedialnych, przeznaczony do monitorowania granic morskich kraju, co jest ważnym zadaniem Morskiego Oddziału Straży Granicznej. System umożliwia przechowywanie, wyszukiwanie i wyświetlanie danych dotyczących zdarzenia będącego obiektem zainteresowania dla Straży Granicznej. Przedstawiono kolejny etap rozwoju projektu STRADAR (Strumieniowa transmisja danych czasu rzeczywistego w rozproszonych...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Speech recognition system for hearing impaired people.

    Publikacja

    - Rok 2005

    Praca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...

  • Telemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy

    Publikacja

    - Rok 2005

    Dzięki pomiarom odpowiedzi neuronalnych i możliwości wyznaczenia na tej podstawie tendencji rozkładu progów stymulacji można lepiej zaprogramować procesor mowy. Jest to niezwykle cenne zwłaszcza u pacjentów nie współpracujących podczas badań (na przykład u małych dzieci). W przypadku takich pacjentów tradycyjne, psychoakustyczne metody doboru parametrów stymulacji przez implant często zawodzą. Natomiast gdy audiolog dysponuje prawdopodobną...

  • PRZEGLĄD METOD PRZETWARZANIA DŹWIĘKU WYKORZYSTYWANYCH W APARATACH SŁUCHOWYCH

    Niniejszy artykuł odnosi się do aktualnego stanu technologii wykorzystywanych w cyfrowych aparatach słuchowych, ze szczególnym uwzględnieniem technik cyfrowego przetwarzania sygnałów dźwiękowych. W artykule przedstawiono czynniki mające wpływ na efektywność aparatów słuchowych, a także zaprezentowano przykłady nowoczesnych metod cyfrowego przetwarzania sygnałów. Przedstawiono również przykłady ograniczeń współczesnych aparatów...

    Pełny tekst do pobrania w portalu

  • Internet-based automatic hearing assessment system

    Publikacja

    - Rok 2005

    Celem referatu jest prezentacja systemu przesiewowego badania słuchu w oparciu o Internet. Wady słuchu stanowią jedną z najszybciej postępujących chorób we współczesnym społeczeństwie. W tym kontekście ważne staje się umożliwienie przeprowadzania masowych testów wykrywających ubytki słuchu. Przedstawiona aplikacja zawiera audiometryczny test tonalny, test ilustrowany dla dzieci oraz test rozumienia mowy w szumie. Po zakończeniu...

  • Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową

    W pracy zaprezentowano oryginalny algorytm estymacji wysokości chwilowej dźwięku. Wykorzystuje on zespolone filtry cyfrowe Hilberta o różnej szerokości pasm przepustowych. W eksperymentach posłużono się filtami nacelowanymi na wyznaczanie częstotliwości krtaniowej (odwrotności okresu drgań strun głosowych) na podstawie zarejestrowanych samogłosek wypowiadanych głosem męskim, żeńskim i dziecięcym. W algorytmie zastosowano estymator...

  • Zastosowanie sieci neuronowych w cyfrowej syntezie dźwięku

    Publikacja

    Rozwój technik związanych z uczeniem maszynowym umożliwia nowe podejście i nowe definiowanie wielu dotychczasowych problemów. Heurystyczne algorytmy stosowane do problemów takich jak klasyfikacja danych w postaci wektorów cech, czy wyróżnianie grup obiektów o podobnych własnościach mogą znaleźć także zastosowanie w takich dziedzinach jak analiza i synteza dźwięków muzycznych. W referacie przybliżone zostały podstawowe zasady projektowania...

  • Finite automata for compact representation of tuple dictionaries.

    Publikacja

    - THEORETICAL COMPUTER SCIENCE - Rok 2004

    Opisane zostaje uogólnienie struktury danych - słownika, zwane słownikiem n-tek. Słownik n-tek przedstawia odwzorowanie n-tek łańcuchów znaków na pewne wartości. Motywacją dla powstania tej struktury danych są praktyczne zastosowania w przetwarzaniu języka i mowy, w których obszerne słowniki n-tek używane są do przedstawiania modeli języka. Przedstawiona zostaje technika oszczędnej reprezentacji słowników n-tek. Ta technika...

    Pełny tekst do pobrania w portalu

  • Investigations of speech signal parameters with regard to articulation influences

    W pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...

  • Contactless Hearing Aid for Infants Employing Signal Processing Algorithms. [Bezkontaktowy aparat słuchowy dla niemowląt wykorzystujący algorytmy przetwarzania sygnału]

    Publikacja

    Zaprojektowany bezkontaktowy aparat słuchowy umiejscawiany jest w łóżeczku niemowlęcia. Aparat składający się z matrycy 4 mikrofonów oraz prototypowej karty z procesorem DSP pracuje w polu swobodnym. Przetworzony sygnał mowy emitowany jest z wykorzystaniem miniaturowych głośników. Opracowane algorytmy pozwalają na elminację akustycznych sprzężeń zwrotnych, które mogą wystepować ze względu na niewielką odległość mikrofonów od głośników...

  • Lokalizacja tekstu w obrazie

    W naturalnym otoczeniu człowieka znajduje się duża ilość łatwo rozpoznawalnej informacji przedstawionej w postaci znaków graficznych i tekstu. Informacja taka jest bardzo przydatna w poruszaniu się w środowisku miejskim. Niestety, osoby z upośledzonymi funkcjami wzroku w sposób oczywisty pozbawione są możliwości korzystania z tego rodzaju przekazu. Istniejące na rynku systemy rozpoznawania tekstu (OCR) nie są niestety dostosowane...

  • Applications of knowledge technologies to sound and vision engineering

    Publikacja

    - Rok 2006

    Specjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...

  • Rejestracja i analiza kontekstu emocjonalnego człowieka w przetwarzaniu wszechobecnym

    Publikacja

    - Rok 2009

    Systemy przetwarzania wszechobecnego tworzące inteligentneśrodowisko podejmują działania na podstawie zebranych informacji nazywanych kontekstem. Umiejętność rozpoznawania ludzkich emocji, jako przejaw wyższej inteligencji, jest ich pożądaną cechą. Istnieje kilka modeli doznań emocjonalnych, które mogą stać się podstawą do budowy uniwersalnego systemu rozpoznającego emocje, bazującego na ekstrakcji cech z danych wejściowych i klasyfkacji...

  • Implementacja usług VoIP na platformie RIK

    Publikacja

    W pracy przedstawiono strukturę platformy RIK (Rozproszonej Infrastruktury Komunikacyjnej) instalowanej na Wydziale ETI PG. Omówiono wymagania dla infrastruktury sieciowej Wydziału ETI umożliwiającej realizacje aplikacji VoIP. Opisano implementacje telefonów IP i usług VoIP w środowisku sieciowym na WETI PG. Scharakteryzowano środowisko programistyczne dla aplikacji VoIP. Zaprezentowano zaimplementowane na Wydziale ETI PG usługi:...

  • Olek - uczeń z autyzmem w szkole integracyjnej

    Publikacja

    - Autyzm - Rok 2014

    Autorami publikacji są rodzice dziecka, którzy podzielili się swoimi spostrzeżeniami z czteroletniej edukacji dziecka z autyzmem w szkole podstawowej, integracyjnej. We wstępie opisano diagnozę, przeprowadzone terapie, pobyt w przedszkolu i rozwój dziecka przed pójściem do szkoły. W drogiej części opisano pobyt dziecka w szkole integracyjnej w klasach 1-4, w szczególności przedstawiono zalety i wady tego typu placówki. Wśród zalet...

  • Modelowanie i pomiary nagłośnienia audytorium

    Uwaga projektantów systemów nagłośnieniowych zogniskowana jest na tzw. akustyce pomieszczenia, w którym realizowany jest przekaz słowny. Zjawiska pogłosowe związane z geometrią sali audytoryjnej, wynikające z wielokrotnych odbić fali dźwiękowej uznawane są za dominujące. Artykuł podejmuje niedoceniany problem wpływu liczby i rozmieszczenia głośników w sali na jakość przekazu. Superpozycji sygnałów dochodzących do słuchacza z wielu...

  • Efficient handover scheme for Mobile IPv4 over IEEE 802.11 networks with IEEE 802.21 triggers.

    Publikacja

    - Rok 2008

    Efektywność przełączania jest bardzo istotnym parametrem, decydującym o pracy sieci bezprzewodowych, realizujacych usługi multimedialne na wysokim poziomie jakości. Użytkownicy takich sieci oczekują ciągłej obsługi podczas procesu przemieszczania się. Okazuje się, że istotnym źródlem opóźnień są nieefektywne procedury przełączania w warstwach drugiej i trzeciej, wynikający częściowo z postulatu o separacji funkcji realizowanych...

  • REJESTRACJA, PARAMETRYZACJA I KLASYFIKACJA ALOFONÓW Z WYKORZYSTANIEM BIMODALNOŚCI

    Praca dotyczy rejestracji i parametryzacji alofonów w języku angielskim z wykorzystaniem dwóch modalności. W badaniach dokonano rejestracji wypowiedzi w języku angielskim mówców, których znajomość tego języka odpowiada poziomowi rodowitego mówcy. W kolejnym etapie wyodrębnione zostały alofony z nagrań fonicznych i odpowiadające im sygnały wizyjne. W procesie tworzenia wektorów cech wykorzystano odrębne systemy parametryzacji,...

    Pełny tekst do pobrania w portalu

  • CPS w multimediach

    Publikacja

    - Rok 2010

    W artykule omówiono działalność badawczą Katedry Systemów Multimedialnych (KSM) w tematach: CPS, technologii multimedialnych, technologii studyjnych i wizyjnych, w zastosowaniach metod soft-computingu w inżynierii dźwięku i obrazu, akustyki muzycznej, psychofizjologii słuchu i wytwarzania mowy, syntezy dźwięku i obrazu oraz akustyki architektonicznej, i techniki nagłaśniania. Przedstawiono wyniki naukowe Katedry - liczbę publikacji,...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • The data exchange between smart glasses and healthcare information systems using the HL7 FHIR standard

    Publikacja

    - Rok 2016

    In this study we evaluated system architecture for the use of smart glasses as a viewer of information, as a source of medical data (vital sign measurements: temperature, pulse rate, and respiration rate), and as a filter of healthcare information. All activities were based on patient/device identification procedures using graphical markers or features based on visual appearance. The architecture and particular use cases were implemented...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • System inteligentnej nawigacji sterowanej głosem

    W pracy rozważa się zagadnienie wykorzystania inteligentnego systemu nawigowania oraz przeglądania serwisu Internetowego z wykorzystaniem głosu. Projekt, na podstawie przeglądu zagadnień, scala istniejące rozwiązania, które umożliwiają sterowanie portalem internetowym za pomocą głosu w języku angielskim. Użytkownik otrzymuje możliwość wydawania komend głosowych, a także zapytań odnośnie zawartości portalu. W odróżnieniu od wielu...

  • Facebook, YouTube, Instagram... jako arbitrzy prawdy. Deepfake – na szlaku dystopii i łasce korporacji

    Publikacja

    - Rok 2020

    Zidentyfikowano ich w 2019 roku w sieci blisko 15 tysięcy . Zwykle nie dotyczą polityki, choć to przede wszystkim w środowisku politycznym budzą strach i zwątpienie. Strach przed dewastacja resztek społecznego zaufania, jakimi politycy się cieszą, zwątpienie – bo zwalczanie ich przekracza polityczne możliwości władz ujmowanych w kartezjańskim podziale władzy. Deepfake – bo o nich mowa – są przełomową innowacją wyznaczającą...

  • Virtual hearing aid - multimedia tool for demonstrating hearing aid benefits

    Publikacja

    - Rok 2005

    Większość osób niedosłyszących nie jest świadoma wszystkich możliwości korekcji ubytku słuchu. Wykorzystując techniki multimedialne można stworzyć oprogramowanie, które znacznie ułatwi i przybliży proces dopasowania aparatów słuchowych. Celem przeprowadzonych eksperymentów było opracowanie multimedialnego systemu, który pozwala zrealizować następujące funkcje: - pomiar charakterystyki dynamiki słuchu, - wyznaczanie charakterystyki...

  • System lokalizacji dla niewidomych, oparty na nawigacji satelitarnej i zliczeniowej

    Publikacja
    • S. Ceranka

    - Rok 2007

    Opracowano, wykonano i przetestowano prototyp urządzenia nawigacyjnego dla osób niewidomych złożony z palmtopa, zawierającego mapę elektroniczną, odbiornika GPS, modułu czujników przyspieszenia i pola magnetycznego oraz klawiatury bezprzewodowej i syntezatora mowy, umożliwiający samodzielne poruszanie się po nieznanym terenie, w szczególności na terenie miasta. W urządzeniu tym zaimplementowano szereg algorytmów wyznaczania położenia...

  • Zmiana szybkości próbkowania z użyciem filtru ułamkowoopóźniającego o zmiennej szerokości pasma

    Współcześnie w zapisie i przetwarzaniu sygnałów dominuje technika cyfrowa, która prawie całkowicie wyparła technikę analogową, między innymi ze względu na możliwość wierniejszego i trwalszego zapisu. Jednak poza swymi zaletami technika cyfrowa stwarza nowe problemy. Między innymi problem stanowi przenoszenie sygnałów cyfrowych pomiędzy systemami pracującymi z różnymi szybkościami próbkowania. Szczególnym wyzwaniem w tym zakresie...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Mówiące Mapy

    Publikacja

    - Rok 2010

    W referacie zaprezentowana została koncepcja oraz wizja prototypu implementacji dedykowanego systemu informacji przestrzennej (GIS) wspierającego samodzielne poruszanie się i nawigację po terenie miejskim osób niewidomych. Po wprowadzeniu w zagadnienie, omówiono wykorzystanie bazy danych przestrzennych miejskiej sieci tras dostępnych dla osób pieszych, co umożliwia systemowi automatyczne znajdowanie optymalnej trasy z punktu...

  • Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych

    Publikacja

    - Rok 2017

    Wniniejszej pracy doktorskiej opisano nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone...

    Pełny tekst do pobrania w portalu

  • Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie

    Publikacja

    - Otorynolaryngologia - Przegląd Kliniczny - Rok 2018

    W opracowaniu dokonano przeglądu dostępnych prac dotyczących różnych rodzajów urządzeń poprawiających słyszenie, które w szczególnych przypadkach mogą być traktowane jako rozwiązania alternatywne w stosunku do klasycznych aparatów słuchowych. Praca zawiera dyskusję na temat nowego rodzaju aparatu słuchowego wstępnie zaprogramowanego, który może być dystrybuowany korespondencyjnie lub bezpośrednio potencjalnym użytkownikom. Ponadto...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • New Applications of Multimodal Human-Computer Interfaces

    Publikacja

    - Rok 2012

    Multimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...