Publikacje
Filtry
wszystkich: 890
Katalog Publikacji
-
Adaptive acoustic crosstalk cancellation in mobile computer device
PublikacjaThe cancellation of acoustic crosstalk is employed to enhance the stereo image in mobile listening conditions. A practical setup employing a mobile computer is employed. The adaptation of the crosstalk cancellation filter to the position of the listener's head is featured. The measurement evaluating the possibility of practical application of the method are described. The head and torso simulator was used for measurements. The...
-
Modelling Object Behaviour in a Video Surveillnace System Using Pawlak's Flowgraph
PublikacjaIn this paper, methodology of acquisition and processing of video streams for the purpose of modelling object behaviour is presented. Multilevel contextual video processing was also mentioned. The Pawlak’s flowgraph is used as a container for the knowledge related to the behaviour of objects in the area supervised by a video surveillance system. Spatio-temporal dependencies in transitions between cameras can be easily changed in...
-
Examining Acoustic Emission of Engineered Ultrasound Loudspeakers
PublikacjaMeasurement results of the sound emitted from an ultrasound custom-made system with high spatial directivity are presented. The proposed system is using modulated ultrasound waves which demodulate in nonlinear medium resulting in audible sound. The system is aimed at enhancing the users’ personal audio space, therefore the measurements are performed using the Head and Torso Simulator which provides the realistic reproduction of...
-
Fitting the mobile device characteristics to the user's hearing preferences
PublikacjaA method for fitting the mobile computer audio characteristics to the user's hearing preferences is proposed. The process consists of two stages: calibration and dynamics processing. During the calibration phase the user performs a loudness scaling test giving their response regarding the perceived loudness. The dynamics processing made on above basis sets the loudness to the most comfortable level. The processing accounts both...
-
SUBJECTIVE PERCEPTION OF MUSIC GENRES IN THE FIELD OF MUSIC INFORMATION RETRIEVAL SYSTEMS
PublikacjaThe aim of this paper is to evaluate the relationship between perception of music genres and subjective features of music that can be assigned to them. For this purpose a group of subjective features such as loudness, melody, rhythm, volume, instrumentation was chosen to describe music genres. A group of 30 listeners with normal hearing, ranging from 20 to 40, was created. Each sub-ject participating in listening tests was asked...
-
Detection of vehicles stopping in restricted zones in video from surveillance cameras
PublikacjaAn algorithm for detection of vehicles that stop in restricted areas, e.g. excluded by traffic rules, is proposed. Classic approaches based on object tracking are inefficient in high traffic scenes because of tracking errors caused by frequent object merging and splitting. The proposed algorithm uses the background subtraction results for detection of moving objects, then pixels belonging to moving objects are tested for stability....
-
Supercomputing Grid-Based Services for Hearing Protection and Acoustical Urban Planning, Research and Education
PublikacjaSpecific computational environments, so-called domain grids, are developed within the PLGrid Plus project in order to prepare specialized IT solutions, i.e., dedicated software implementations and hardware (infrastructure adaptation), suited for particular research group demands. One of the PLGrid Plus domain grids, presented in this paper, is Acoustics. The article describes in detail two kinds of the acoustic domain services....
-
An Approach to Bass Enhancement in Portable Computers Employing Smart Virtual Bass Synthesis Algorithms
PublikacjaThe aim of this paper is to present a novel approach to the Virtual Bass Synthesis (VBS) algorithms applied to portable computers. The developed algorithms are related to intelligent, rule-based setting of synthesis parameters according to music genre of an audio excerpt and to the type of a portable device in use. To find optimum synthesis parameters of the VBS algorithms, subjective listening tests based on a parametric procedure...
-
Aktywny system RFID do lokalizacji i identyfikacji obiektów w wielomodalnej infrastrukturze bezpieczeństwa
PublikacjaPrzedstawiono prace koncepcyjne, badawcze oraz implementacyjne skoncentrowane na praktycznej realizacji systemu detekcji obiektów z wykorzystaniem kamer wizyjnych i identyfikacji radiowej. Zaproponowano rozbudowę wielomodalnego teleinformatycznego systemu bezpieczeństwa o warstwę identyfikacji radiowej obiektów. Omówiono założenia zaprojektowanego systemu oraz opracowaną warstwę sprzętową. Zaproponowano i przedyskutowano praktyczne...
-
An Approach to the Detection of Bank Robbery Acts Employing Thermal Image Analysis
PublikacjaA novel approach to the detection of selected security-related events in bank monitoring systems is presented. Thermal camera images are used for the detection of people in difficult lighting conditions. Next, the algorithm analyses movement of objects detected in thermal or standard monitoring cameras using a method evolved from the motion history images algorithm. At the same time, thermal images are analyzed in order to detect...
-
Further Developments of the Online Sound Restoration System for Digital Library Applications
PublikacjaNew signal processing algorithms were introduced to the online service for audio restoration available at the web address: www.youarchive.net. Missing or distorted audio samples are estimated using a specific implementation of the Jannsen interpolation method. The algorithm is based on the autoregressive model (AR) combined with the iterative complementation of signal samples. Since the interpolation algorithm is computationally...
-
Inteligentna Synteza Niskich Częstotliwości w urządzeniach mobilnych
PublikacjaW pracy przedstawiono algorytm inteligentnej adaptacji parametrów syntezy niskich częstotliwości w urządzeniach przenośnych w zależności od odtwarzanego gatunku muzycznego (Smart VBS). Proponowany algorytm wykorzystuje metody generacji harmonicznych oparte na generatorze funkcji nieliniowych (NLD) i wokoderze fazowym (PV). Dla znalezienia optymalnych parametrów syntezy przeprowadzono testy subiektywne sprawdzające powiązanie parametrów...
-
Smart Virtual Bass Synthesis Algorithm Based on Music Genre Classification
PublikacjaThe aim of this paper is to present a novel approach to the Virtual Bass Synthesis (VBS) algorithms applied to portable computers. The proposed algorithm employed automatic music genre recognition to determine the optimum parameters for the synthesis of additional frequencies. The synthesis was carried out using the non-linear device (NLD) and phase vocoder (PV) methods depending on the music excerpt genre. Classification of musical...
-
Video analytics-based algorithm for monitoring egress from buildings
PublikacjaA concept and a practical implementation of the algorithm for detecting of potentially dangerous situations related to crowding in passages is presented. An example of such a situation is a crush which may be caused by an obstructed pedestrian pathway. The surveillance video camera signal analysis performed in the online mode is employed in order to detect hold-ups near bottlenecks like doorways or staircases. The details of the...
-
Music Recommendation System
PublikacjaThe paper focuses on optimization vector content feature for the music recommendation system. For the purpose of experiments a database is created consisting of excerpts of music les. They are assigned to 22 classes corresponding to dierent music genres. Various feature vectors based on low-level signal descriptors are tested and then optimized using correlation analysis and Principal Component Analysis (PCA). Results of the experiments...
-
EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY
PublikacjaThe problem of video framerate and audio/video synchronization in audio-visual speech recogni-tion is considered. The visual features are added to the acoustic parameters in order to improve the accuracy of speech recognition in noisy conditions. The Mel-Frequency Cepstral Coefficients are used on the acoustic side whereas Active Appearance Model features are extracted from the image. The feature fusion approach is employed. The...
-
Eye-Gaze Tracking-Based Telepresence System for Videoconferencing
PublikacjaAn approach to the teleimmersive videoconferencing system enhanced by the pan-tilt-zoom (PTZ) camera, controlled by the eye-gaze tracking system, is presented in this paper. An overview of the existing telepresence systems, especially dedicated to videoconferencing is included. The presented approach is based on the CyberEye eye-gaze tracking system engineered at the Multimedia Systems Department (MSD) of Gdańsk University of Technology...
-
Application of PL-Grid Platform for Modeling of the Selected Acoustic Phenomena
PublikacjaDomain grids are specific computational environments, developed within the PLGrid Plus project. For the Acoustic domain grid two supercomputer grid based services were prepared. Dedicated software consists of the outdoor sound propagation module and psychoacoustical noise dosimeter. The results are presented in a form of maps of sound level and Temporary Threshold Shift (TTS) values, therefore the services may play an informative...
-
MODELOWANIE PROPAGACJI HAŁASU I JEGO WPŁYWU NA SŁUCH Z WYKORZYSTANIEM PLATFORMY OBLICZENIOWEJ PL GRID PLUS
PublikacjaW referacie przedstawiono usługi dostępne w gridzie dziedzinowym Akustyka, opracowane w ramach projektu PL Grid Plus. Przygotowane usługi umożliwiają modelowanie propagacji hałasu w środowisku aglomeracji miejskiej pochodzącego ze źródeł liniowych (drogi), punktowych lub powierzchniowych (hałas przemysłowy, imprezy plenerowe) z wykorzystaniem klastrów oblicze-niowych. Na podstawie uzyskanych wyników rozkładu poziomu hałasu możliwe...
-
Auto adaptation of mobile device characteristics to various acoustic conditions
PublikacjaThe proposed methodology of auto adaptation of the mobile device characteristics to various acoustic conditions is presented in the paper. The first goal of this study was to determine the parameters of the acoustic path of the mobile device, for both transmitting (speaker) and receiver (microphone). Results of the measurement of characteristics of mobile devices were presented. Information about characteristics of individual parts...
-
OBRAZOWANIE ROZKŁADU NATĘŻENIA DŹWIĘKU W OTOCZENIU URZĄDZENIA MOBILNEGO Z WYKORZYSTANIEM WEKTOROWYCH CZUJNIKÓW AKUSTYCZNYCH
PublikacjaW referacie przedstawiono wyniki pomiarów rozkładu natężenia dźwięku w otoczeniu urządzenia mobilnego. Rozkład energii akustycznej pozyskano w polu swobodnym z wykorzystaniem metody natężeniowej w dziedzinie widma. W tym celu zastosowano zintegrowaną sondę natężeniową składającą się z czujników pomiaru przepływu cząstek powietrza oraz ciśnienia akustycznego. Pojedynczy czujnik przepływu cząstek powietrza jest czuły w jednej płaszczyźnie....
-
A hybrid speech codec employing parametric and perceptual coding techniques
PublikacjaW referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...
-
Improving signal quality in speech codec using hybrid perceptual-parametric algorithm. [Poprawa jakości sygnału w kodekach mowy przy użyciu hybrydowego, parametryczno-perceptualnego algorytmu kodowania]
PublikacjaPrzedstawiono hybrydową, parametryczno-perceptualną architekturę kodeka. Podstawowa struktura kodeka parametrycznego CELP została wzbogacona o kodowanie perceptualne. Celem hybrydyzacji kodeka jest uzyskanie znaczącej poprawy subiektywnej jakości zdekodowanego sygnału. Zaproponowano dwie hybrydowe struktury. Pierwsza polega na perceptualnym kodowaniu dźwięcznych elementów sygnału rezydualnego kodeka CELP. Druga metoda dzieli sygnał...
-
High quality speech coding using combined parametric and perceptual modules. [Kodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego]
PublikacjaW komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne...
-
Contactless Hearing Aid for Infants Employing Signal Processing Algorithms. [Bezkontaktowy aparat słuchowy dla niemowląt wykorzystujący algorytmy przetwarzania sygnału]
PublikacjaZaprojektowany bezkontaktowy aparat słuchowy umiejscawiany jest w łóżeczku niemowlęcia. Aparat składający się z matrycy 4 mikrofonów oraz prototypowej karty z procesorem DSP pracuje w polu swobodnym. Przetworzony sygnał mowy emitowany jest z wykorzystaniem miniaturowych głośników. Opracowane algorytmy pozwalają na elminację akustycznych sprzężeń zwrotnych, które mogą wystepować ze względu na niewielką odległość mikrofonów od głośników...
-
Tinnitus diagnosis and therapy method employing ultrasound dithering.
PublikacjaZaproponowano interpretację sposobu powstawania szumów usznych w oparciu o teorię kwantyzacji sygnału. Przedstawiono stan prac nad urządzeniem ultradźwiękowym do maskowania szumów usznych, opartym na tej teorii.
-
Detekcja obrazu pojazdów w nagraniach wideo oraz eliminacja pasożytniczych sprzężeń akustycznych
PublikacjaReferat prezentuje dwa niezależne rozwiązania z dziedziny inżynierii dźwięku i obrazu. Pierwsze z nich dotyczy wykrywania obrazu ruchomych pojazdów w nagraniach wideo dla zastosowań w monitoringu ruchu drogowego. Detekcja pojazdów odbywa się poprzez porównanie bieżącej ramki obrazu z modelem tła tworzonym w oparciu o sumę ważoną funkcji Gaussowskich. Zbadano skuteczność tej metody w oparciu o przykładowe nagrania ruchu ulicznego....
-
Wykorzystanie nowych metod wnioskowania w grafice i animacji komputerowej
PublikacjaReferat opisuje realizowane zadania badawcze, dotyczące wykorzystana nowych metod wnioskowania (tzw. soft-computingu) w przetwarzaniu grafiki i animacji komputerowej. W pierwszym z zadań, opracowaniu metody poprawy jakości fotografii tekstu przeznaczonych do rozpoznawania znaków, wykorzystano algorytmy przetwarzania obrazów i ich modyfikacje do usuwania ze zdjęcia tła oraz gradientu jasności, następnie nowa metoda filtracji nieliniowej...
-
Dithering strategy applied to tinnitus masking.
PublikacjaW referacie przedstawiono teorię wyjaśniającą zjawisko szumów usznych na gruncie akustyki, elektroniki i telekomunikacji. Spostrzeżenie, że słuch jest w istocie akustycznym układem transmisyjnym, skłania do poszukiwania interpretacji powstawania szumów usznych w ogólnej teorii spontanicznego generowania szumu w układach transmisyjnych. Sformułowana hipoteza wskazuje na istnienie pasożytniczej kwantyzacji, która pojawia się w sytuacji...
-
Investigation of Noise Threats and Their Impact on Hearing in Selected Schools
PublikacjaNoise measurements conducted in selected schools in Gdansk area are presented in this paper. The main aim of this research was to determine noise threats at schools. Some objective measurements of the acoustic climate were performed employing a noise monitoring station engineered at the Multimedia System Department, Gdansk University of Technology. Simultaneously, subjective noise annoyance examinations were carried out among pupils...
-
Adjustable fractional-delay filters utilizing the Farrow structure and multirate techniques. [Przestrajalne filtry o opóźnieniu ułamkowym wykorzystujące strukturę Farrowa i techniki wieloszybkościowe]
PublikacjaDo efektywnej realizacji ułamkowo opóźniających, przestrajalnych filtrów FIR (o skończonej odpowiedzi impulsowej) można wykorzystywać strukturę Farrowa. Jednakże, niezależnie od efektywności w porównaniu z innymi strukturami, jej złożoność implementacyjna szybko rośnie ze wzrostem szerokości pasma filtru. Celem zredukowania złożoności numerycznej, zaproponowano podejście wieloszybkościowe. W tym podejściu sygnał wejściowy jest...
-
Komputerowe modelowanie dźwiękowodu aparatu słuchowego
PublikacjaW artykule opisano metodę komputerowego modelowania dźwiękowodu aparatu słuchowego. Model opracowany został z wykorzystaniem metody falowodowej. Symulacje komputerowe umożliwiają zbadanie właściwości akustycznych dźwiękowodów o różnych parametrach. Opisany model może zostać zastosowany w systemie dopasowywania aparatu słuchowego do potrzeb jego użytkownika, w celu zminimalizowania zniekształceń dźwięku wprowadzanych przez dźwiękowód...
-
Zastosowanie przetwarzania rozmytego w animacji komputerowej
PublikacjaReferat przedstawia projekt systemu ekspertowego do tworzenia animacji komputerowych. Założono, iż wykorzystanie reguł animacji tradycyjnej i przetwarzania rozmytego może przyspieszyć proces tworzenia animacji komputerowych i pozwoli uzyskiwać animacje o wysokiej jakości wizualnej, nie ustępujące anima-cjom przygotowanym w całości przez animatora. Wejściem do systemu jest prosta animacja oraz opis ruchu pożądanego przez użytkownika....
-
Intelligent algorithms for movie sound track restoration
PublikacjaW artykule przedstawiono dwa algorytmy do rekonstruowania optycznych ścieżek dźwiękowych. Pierwszy z nich jest zastosowaniem miary nieprzewidywalności do obliczeń parametrów modelu psychoakustycznego stosowanego do redukowania szumów. Drugi stanowi precyzyjną procedurę oceny pasożytniczej modulacji częstotliwości, opartej na analizie składowych harmonicznych. Wyniki zastosowania obu wymienionych algorytmów są zawarte w artykule.
-
Role of various parametres in automatic classification of musical instrument sound.
PublikacjaArtkuł dotyczy problemu automatycznej klasyfikacji dźwięków instrumentów muzycznych, w tym głównie wpływu indywidualnych parametrów na proces automatycznego rozpoznawania instrumentów. Parametryzacja wykorzystuje wdirmo Fourierowskie i analizę czasową dźwięków do formowania 14 i 62-parametrowych wektorów cech dystynktywnych. Autorzy porównują jakość rozpoznawania i rozróźnialność instrumentów. Przy ocenach tego typu stosowano drzewa...
-
Digital hearing aid with time and spectral transposition.
PublikacjaNastępstwem uruchomienia w Polsce, prowadzonych na szeroką skalę, badań przesiewowych słuchu jest konieczność zaoferowania pomocy osobom cierpiącym na niedosłuch poprzez leczenie i protetykę słuchu. Tymczasem, aktualnie oferowane rozwiązania aparatów słuchowych nie są w stanie sprostać niektórym specjalistycznym potrzebom aparatowania, m. in.: najmłodszych dzieci, osób pracujących w hałasie, pilotów wojskowych oraz osób korzystających...
-
Multimodal learning application with interactive animated character. [Multimodalna aplikacja edukacyjna wykorzystująca interaktywną animowaną postać]
PublikacjaThe aim of this study is to design a computer application that may assist teachers and therapists in multimodal manner in their work with impaired or disabled children. The application can be operated in many different ways, giving to a child with special educational needs a possibility to learn and train many skills or treat speech disorders. The main stress in this research is on the creation of animated character that will serve...
-
Employing fuzzy logic to processing of loudness scaling test results
PublikacjaW procesie dopasowania współczesnych aparató słuchowych wymagana jest znajomość charakterystyki dynamiki słyszenia. Charaketrystyka dynamiki słyszenia wyznaczana jest na podstawie wyników testu skalowania głośności. Problem w tym, że wyniki testu skalowania głośności wyrażone są w skali kategorii oceny wrażenia głośności, natomiast aparaty słuchowe wymagają parametrów określonych na skali numerycznej. Logika rozmyta jest jedną...
-
Audiovisual speech recognition for training hearing impaired patients
PublikacjaPraca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...
-
New digital aids for pateints after laryngectomy
PublikacjaPowrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej...
-
Pitch shifter with complex instantaneous frequency rescaling and direct digital synthesis
PublikacjaW artykule zaprezentowano nowy przesuwnik wysokości dźwięku ze skalowaniem częstotliwości chwilowej i z syntezą bezpośrednią. Jest on przeznaczony do komponowania melodii np. w telefonie komórkowym. Implementacja przesuwnika jest oparta na twierdzeniu Bedrosiana, zastosowanego do zespolonego odpowiednika hilbertowskiego przetwarzanego sygnału rzeczywistego. Filtr Hilberta pełni tu też dodatkową rolę. Jest nią filtracja antyaliasingowa....
-
It applications for the remote testing of hearing.
PublikacjaTelemedycyna odgrywa coraz wiekszą rolę w diagnostyce i leczeniu osób z ubytkami słuchu. Jest to związane m.in. ze specyfiką badań audiometrycznych. Postęp technologiczny w dziedzinie aparatów słuchowych i implantów ślimakowych wymusza nowe metody diagnozy w audiologii, jak również w praktyce otolaryngologicznej. Serwis ''Telezdrowie'', w którym zaimplementowano liczne testy przesiewowe jest przykładem prowadzenia diagnostyki w...
-
The Farrow structure for the Hilbert transform filter
PublikacjaPrzedstawiono nową implementację cyfrowego filtru Hilberta, wykonaną w strukturze Farrowa. Jest to filtr zespolony, realizujący jednocześnie dwie różne operacje liniowe, wykonywane dotychczas za pomocą osobnych filtrów. Pierwsza z nich polega na standardowej filtracji hilbertowskiej. Tworzy ona zespolony "analityczny" odpowiednik rzeczywistego sygnału wejściowego. Drugą, osiąganą za pomocą prze-próbkowania ze współczynnikiem, w...
-
Multimedia mobile services for the semantic web
PublikacjaDokument przedstawia metodologię tworzenia semantycznie rozszerzonych multimedialnych usług mobilnych z wykorzystaniem narzędzi i ułatwień oferowanych przez projekt DESYME. Zaprezentowano zwięzły wstęp do tematyki sieci Semantycznej wraz z wyjaśnieniem jej związku z zagadnieniami Web Services. Następnie przedstawiono opis projektu DESYME. Przedstawiono również przykładowe usługi multimedialne, które są opracowywane w Katedrze Systemów...
-
Analiza sygnału mowy w foniatrii
PublikacjaPraca zawiera opis algorytmów analizy sygnału mowy opracowanych do zastosowań medycznych. Mają one znaczenie wspomagające w diagnostyce schorzeń krtani, objawiających się jako np. chrypka, dwugłos oraz nieprawidłowa artykulacja tonu krtaniowego (głos drżący). Opisano algorytmy służące do ekstrakcji tonu krtaniowego (parametr F0 i jego przebieg zmienności w czasie) oraz do wygładzania widma (np. do estymacji parametrów formantowych...
-
Multimedia System for Environmental Noise Monitoring. [Multimedialny System Monitorowania Hałasu Środowiskowego]
PublikacjaIntroductionNumerous reports relating to noise threats in Poland indicate that they occur commonly. The noise has an enormous impact on the health and life quality of the human beings. Noise pollution in Poland is greater than in others UE countries, moreover it has been increased recently. Taking into account 2002/49/WE directive related to the control and assessment of environmental noise a necessity of monitoring these threats...
-
Investigation of noise threats and their impact on hearing in selected schools - a pilot study.
PublikacjaNoise measurements conducted in selected schools in Gdansk area are presented in this paper. The main aim of this research was to determine noise threats at schools. Some objective measurements of the acoustic climate were performed employing a noise monitoring station engineered at the Multimedia System Department, Gdansk University of Technology. Simultaneously, subjective noise annoyance examinations were carried out among pupils...
-
Vowel recognition based on acoustic and visual features
PublikacjaW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...
-
Transient detection for speech coding applications
PublikacjaSignal quality in speech codecs may be improved by selecting transients from speech signal and encoding them using a suitable method. This paper presents an algorithm for transient detection in speech signal. This algorithm operates in several frequency bands. Transient detection functions are calculated from energy measured in short frames of the signal. The final selection of transient frames is based on results of detection...
-
Contactless hearing aid designed for infants
PublikacjaIt is a well known fact that language development through home intervention for a hearing-impaired infant should start in the early months of a newborn baby's life. The aim of this paper is to present a concept of a contactless digital hearing aid designed especially for infants. In contrast to all typical wearable hearing aid solutions (ITC, ITE, BTE), the proposed device is mounted in the infant's bed with any parts of its set-up...