Publikacje
Filtry
wszystkich: 891
Katalog Publikacji
Rok 2009
-
Multimedialny system monitorowania aglomeracji miejskich
Publikacja -
Multimedialny system wspomagający identyfikację i zwalczanie przestępczości oraz terroryzmu
PublikacjaArtykuł zawiera przegląd zakresu prac badawczych, które prowadzone są w Politechnice Gdańskiej w ramach realizowanego projektu badawczo-rozwojowego. Opisany jest rozproszony system monitoringu i komunikacji multimedialnej, realizujący kompleksowe zarządzanie zasobami mobilnymi i komunikację multimedialną w czasie rzeczywistym pomiędzy elementami systemu. System realizuje równoczesną analizę obrazu, dźwięku i sygnałów pochodzących...
-
Nagranie formy muzycznej w systemie stereofonii dookólnej
PublikacjaCelem pracy była realizacja nagrania kwintetu jazzowego w wybranych systemach stereofonii wielokanałowej. Dodatkowym celem było przeprowadzenie testów subiektywnych zrealizowanych nagrań. W pracy zawarto w pierwszej kolejności zagadnienia związane z przestrzenną lokalizacją źródeł dźwięku przez człowieka. W dalszej części przywołane zostały wybrane techniki mikrofonowe stereofonii wielokanałowej, a także metody prowadzenia testów...
-
New method for personalization of avatar animation
PublikacjaThe paper presents a method for creating a personalized animation of avatar utilizing fuzzy inference. First the user designs a prototype version of animation, with keyframes only for important poses, roughly describing the action. Then animation is enriched with new motion phases calculated by the fuzzy inference system using descriptors given by the user. Various degrees of motion fluency and naturalness are possible to achieve....
-
New technology for hearing stimulation employing the SPS-S method
PublikacjaIstotnym założeniem metody SPS-S jest możliwość stosowania treningu słuchowego w warunkach życia codziennego, a więc także poza gabinetami placówek terapeutycznych. Mobilne urządzenie - stymulator słuchu jest oparte na najnowszej technologii mikroelektronicznej, Oferuje on możliwość wykorzystywania wielu programów terapii, które przebiegają z zastosowaniem algorytmów cyfrowego przetwarzania dźwięku. Algorytmy te można podzielić...
-
Non-intrusive infrared-free eye tracking method
PublikacjaIn the paper a technique of eye tracking based on visible light is presented. The approach described does not require an additional hardware equipment used in the infrared eye tracking system. First, examples of existing eye tracking techniques were presented. Then, the proposed algorithm of image processing and the process of determining the eye position are described. The engineered eye tracking application was tested and the...
-
Nowa metoda oceny szkodliwości hałasu,uwzględniająca psychoakustyczne właściwości słuchu
PublikacjaW referacie przedstawiono koncepcję, algorytm oraz wyniki działania Psychoakustycznego Dozymetru Hałasowego (PDH). Opracowana metoda opiera się na wykorzystaniu wiedzy na temat właściwości słuchu dostęp-nej w literaturze oraz na wynikach badań słuchu i hałasu przeprowadzonych w warunkach laboratoryjnych. Stanowi nowe podejście do zagadnienia oceny szkodliwości hałasu. W tym celu zaproponowano nowe wskaźniki oceny skumu-lowanych...
-
On the use of instantaneous complex frequency for analysis and modification of simple sounds
PublikacjaW pracy przedstawiono możliwości wykorzystania zespolonej pulsacji chwilowej do analizy i modyfikacji prostych dźwięków. Opisywany algorytm składa się z dwóch kroków: bifaktoryzacji sygnału na obwiednię minimalnofazową i fazor dodatnipskrętny, a następnie estymacja i modyfikacja zespolonej pulsacji chwilowej obu czynników faktoryzacji.
-
Overview of current communication systems for security forces. Features, limitations and potential solutions
Publikacja -
Pasywny Radar Akustyczny
Publikacja -
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
PublikacjaW pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.
-
Postprodukcja nagrania wideo z dzwiekiem dookolnym
PublikacjaOne of the aims of this paper is to present issues related to audio-video correlation. This is presented on the basis of a short film realization employing surround microphone techniques. First, some related works in the domain of sound and vision correlation are presented. Then assumptions concerning scene creation related to both audio and video are shortly described. Another objective is to discuss results of subjective tests...
-
Realizacja specjalnych filtrów cyfrowych o strukturze Farrowa
PublikacjaRozprawa doktorska jest wynikiem pracy nad projektowaniem i implementacją cyfrowych filtrów specjalnych z opóźnieniem ułamkowym za pomocą jednostopniowego przestrajalnego, nierekursywnego filtru o strukturze Farrowa. Założone cele pracy, sformułowane na str. 2, zostały osiągnięte. Wszystkie opisane w pracy filtry zaimplementowano w środowisku obliczeniowym MATLAB i przebadano w celu weryfikacji ich właściwości. Pokazano, że wszystkie...
-
Rozpoznawanie kategorii ruchu ludzkiego na podstawie analizy sygnałów pochodzących z trójosiowych czujników przyspieszenia
PublikacjaW artykule przedstawiono procedurę rejestracjisygnałów przyspieszenia pochodzących z czujnikówbiomedycznych Shimmer, sposób ich rozmieszczenia na ciele orazopisano klasyfikator pozwalający na rozpoznawanie wybranychkategorii ruchu ludzkiego. W części eksperymentalnej artykułuzbadano wpływ filtracji dolnoprzepustowej sygnałów naskuteczność rozpoznawania typu aktywności ruchowej.
-
Software for calculation of noise maps implemented on the supercomputer
PublikacjaThis paper presents investigation results relevant to the implementation of the algorithms for the calculation of noise maps. The aim of the implementation of the algorithms on the computer cluster is explained. Selected implementation details of the software called the noise propagation model are described. The interaction of the software with the data acquisition system is presented. Noise maps obtained by exploitation of the...
-
SPS-S - nowa metoda stymulacji słuchowej
PublikacjaIstotnym założeniem metody SPS-S jest możliwość stosowania treningu słuchowego w warunkach życia codziennego, a więc także poza gabinetami placówek terapeutycznych. Mobilne urządzenie - stymulator słuchu jest oparte na najnowszej technologii mikroelektronicznej, Oferuje on możliwość wykorzystywania wielu programów terapii, które przebiegają z zastosowaniem algorytmów cyfrowego przetwarzania dźwięku. Algorytmy te można podzielić...
-
State of Deliverable D1.1 of INDECT Project
Publikacja -
Surveillance camera tracking of GEO positioned objects
PublikacjaRozdział opisuje system sterowania kamerami ruchomymi PTZ realizujący śledzenie poruszającego się obiektu o znanej pozycji GPS. Przedstawione są idea systemu oraz możliwości jego wykorzystania. Opisane są: procedura kalibracji pola widzenia kamery i sposób powiązania z danymi o lokalizacji, procedura predykcji ruchu w celu kompensacji opóźnień czasowych. Omówiony jest zaimplementowany system modułowy, w którego skład wchodzą: terminale...
-
System monitorujący stopień koncentracji uwagi uczniów
PublikacjaSystem śledzenia punktu fiksacji wzroku pozwala śledzić miejsce na ekranie monitora, na które patrzy użytkownik. W niniejszym artykule opisano system śledzenia punktu fiksacji wzroku w kontekście nowoczesnego zastosowania - w badaniu stopnia koncentracji uwagi u dzieci. W części pierwszej artykułu przedstawiono konfigurację sprzętową systemu oraz scharakteryzowano zagadnienie koncentracji uwagi. W drugiej, właściwej części, opisano...
-
The project MAYDAY EURO 2012. Overview and relation to INDECT
Publikacja -
Time-scale modification of speech signals for supporting hearing impaired schoolchildren
PublikacjaA study of time scale modification algorithmsapplied to hearing impaired schoolchildren supporting ispresented. Variety of algorithms are considered, namely:overlap and add, two variations of synchronized overlapand add, and the phase vocoder. Their effectiveness as wellas real-time processing capabilities are examined.
-
Tonality Estimation and Frequency Tracking of Modulated Tonal Components
PublikacjaA novel method for tonality estimation and frequency tracking of tonal components modulated in frequency and amplitude is presented. The algorithm detects the local maxima of magnitude spectra corresponding to three contiguous frames of a signal and matches them into the tonal track candidates. The magnitude-based and phase-based methods are used to estimate the frequency jumps between spectrum maxima belonging to the tonal track...
-
Ustomysz
Publikacja -
WP1: Intelligent Monitoring and Automatic Detection of Threats - partners cooperation
Publikacja -
WP1: Intelligent monitoring and automatic detection of threats -introduction to the WP1
Publikacja -
WP1 of INDECT Project: Intelligent Monitoring and Automatic Detection of Threats
Publikacja -
WP7 Applications proposed by GUT. Use Cases and Benchmarks
Publikacja -
Zastosowanie reguł rozmytych w komputerowej animacji postaci - wybrane zagadnienia
PublikacjaCelem badawczym rozprawy było wykazanie możliwości wykorzystania inteligentnych metod obliczeniowych, głównie logiki rozmytej, w animacji komputerowych postaci. Powstał system pozwalający w sposób półautomatyczny tworzyć animacje płynne i nacechowane stylistycznie. Poprawność wykorzystanego podejścia została zweryfikowana w toku testów oceny z udziałem dużej liczby widzów-ekspertów.
-
Zastosowanie sieci Mobile WiMAX w aglomeracji
Publikacja -
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
PublikacjaThis paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
Rok 2008
-
A fractionally delaying complex Hilbert transform filter
PublikacjaPrzedstawiono nowy, dyskretno-czasowy, ułamkowo-opóźniający (FD od ang. fractional delayor), zespolony filtr Hilberta (HTF od ang. Hilbert transform filter) nazwany FDHTF. Filtr ten jest oparty na parze obróconych filtrów o zmiennym opóźnieniu ułamkowym (VFD od ang. variable fractional delayor). Za pomocą filtru FDHTF realizuje się jednocześnie filtrację Hilberta i wprowadzanie ułamkowego opóźnienia do przetwarzanego sygnału. Dzięki...
-
A low complexity double-talk detector based on the signal envelope
PublikacjaA new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...
-
A novel dynamic noise maps visualization tool
PublikacjaW referacie przedstawiono aplikację realizujacą wizualizację dynamicznych map akustycznych zintegrowaną z multimedialnym systemem monitoringu hałasu. Moduł ten został oparty na nowym podejściu do wykreślania dynamicznych map, w referacie przedstawiono porównanie wyników uzyskanych metodami tradycyjnymi i zaproponowaną metodą. Słowa kluczowe: dynamiczne mapy, wizualizacja, monitoring, hałas, system GIS
-
A recursive multi-output dicrete-time sinusoidal oscillator
PublikacjaZaproponowano wielo-wyjściowy cyfrowy oscylator sinusoidalny. Przedstawiono performancję tego oscylatora. Oscylator generuje sinusoidy: o zadanych fazach początkowych i o jednostkowej amplitudzie, przy użyciu algorytmów rekursywnych. Wprowadzona tu macierz rotacji zespolonego oscylatora unifikuje różne struktury zespolonych oscylatorów i pozwala na wprowadzenie nowych struktur trójfazowych, cztero-fazowych i ogólnie wielo-fazowych...
-
Automatic detection and correction of detuned singing system for use with query-by-humming applications
PublikacjaThe aim of the paper is to present an idea of using the automatic detection and correction of detuned singing as a subsystem in query-by-humming (QBH) applications. The common approach to searching for a requested song basing on the melody retrieved from hummed pattern usually employs the so-called Parsons code or melody contour. In such a case information about sound pitch is discarded. It was thought out that an additional module...
-
Automatic detection and correction of detuned singing system for use with query-by-humming applications
PublikacjaThe aim of the paper is to present an idea of using the automatic detection and correction of detuned singing as a subsystem in query-by-humming (QBH) applications. The common approach to searching for a requested song basing on the melody retrieved from hummed pattern usually employs the so-called Parsons code or melody contour. In such a case information about sound pitch is discarded. It was thought out that an additional module...
-
Automatic Rhythm Retrieval from Musical Files
PublikacjaThis paper presents a comparison of the effectiveness of two computational intelligence approaches applied to the task of retrieving rhythmic structure from musical files. The method proposed by the authors of this paper generates rhythmic levels first, and then uses these levels to compose rhythmic hypotheses. Three phases: creating periods, creating simplified hypotheses and creating full hypotheses are examined within this study....
-
Automatic singing quality recognition employing artificial neural networks
PublikacjaCelem artykułu jest udowodnienie możliwości automatycznej oceny jakości technicznej głosów śpiewaczych. Pokrótce zaprezentowano w nim stworzoną bazę danych głosów śpiewaczych oraz zaimplementowane parametry. Przy pomocy sztucznych sieci neuronowych zaprojektowano system decyzyjny, który oceniono w pięciostopniowej skali jakość techniczną głosu. Przy pomocy metod statystycznych udowodniono, że wyniki generowane przez ten system...
-
Automatic Singing Voice Recognition EmployingNeural Networks and Rough Sets
PublikacjaCelem badań jest automatyczne rozpoznawanie głosów śpiewaczych w kategorii rodzaju i jakości technicznej śpiewu. W artykule opisano stworzoną bazę danych głosów, która zawiera próbki głosu śpiewaków profesjonalnych i amatorskich. W dalszej części opisano parametry zdefiniowane w oparciu o zjawiska biomechaniczne w narządzie głosu podczas śpiewania. W oparciu o stworzone macierze parametrów wytrenowano i porównano automatyczne klasyfikatory...
-
Automatic sound recognition for security purposes
PublikacjaIn the paper an automatic sound recognition system is presented. It forms a part of a bigger security system developed in order to monitor outdoor places for non-typical audio-visual events. The analyzed audio signal is being recorded from a microphone mounted in an outdoor place thus a non stationary noise of a significant energy is present in it. In the paper an especially designed algorithm for outdoor noise reduction is presented,...
-
Automatic system for audio-video material reconstruction and archiving
PublikacjaReferat przedstawia propozycję modelu systemu automatycznej archiwizacji i rekonstrukcji nagrań audio-wideo. Założeniem tego rozwiązania jest uczynienie procesu rekonstrukcji nagrań bardziej niezależnym od człowieka. Ma to na celu redukcję kosztów rekonstrukcji przetwarzanych nagrań. Z powodu dużej liczby archiwalnych nagrań audio-wideo istnieje potrzeba stworzenia systemu który umożliwi automatyczną indeksację ich treści. Pomoże...
-
Comparison of developed gaze point estimation methods
PublikacjaThis paper presents the software part of an inexpensive hands-free eye tracking system. The system works using infrared illumination like most of the available eye trackers. Two methods allowing estimation the gaze point on computer screen are compared. Research on effectiveness of these methods is discussed and the better one is indicated.
-
Drift, wow and flutter measurement and reduction in shrunken movie soundtracks
PublikacjaReferat przedstawia metodę i algorytmy do oceny i redukcji dryfu, kołysania i drżenia w skurczonych taśmach filmowych. Przedstawione algorytmy działają w oparciu o przetwarzaniu obrazu taśmy filmowej w celu wyznaczenia jej lokalnego skurczu, który jest jednym z powodów powstawania dryfu, kołysania i drżenia. Lokalny skurcz taśmy można wyznaczyć dzięki analizie wysokości: ramki obrazu, perforacji, lub innego, standaryzowanego elementu...
-
efficient fractional delay hilbert transform filter in the farrow structure
PublikacjaIn this paper the design and application of a Fractional Delay Hilbert Transform Filter (FDHTF) into an adaptive sub-sample delay estimation between two separated sinusoidal signals is considered. The FDHTF incorporates the functions of Hilbertian and variable fractional delay filtering of the incoming signal simultaneously, in one stage. In traditional approach each of these operations was performed separately. Obtained value...
-
Evaluation of excessive noise effects on hearing employing psychoacoustic dosimetry
PublikacjaResearch results regarding the noise impact on hearing applying the concept of the Psychoacoustic Noise Dosimetry (PND) are presented. The general characteristics of the PND algorithm are discussed. Additionally, the results of hearing examinations conducted in the laboratory conditions are shown. The main objective of the research was to determine the time needed for the Temporary Threshold Shift to reverse. The results were used...
-
Hearing aid fitting method based on fuzzy logic processing
PublikacjaWażnym etapem dopasowania współczesnych aparatów słuchowych jest wyznaczanie charakterystyki dynamiki słuchu. Charakterystyka ta wyznaczana jest na podstawie wyników testu skalowania głośności. Niestety wyniki te wyrażone są w skali kategorii głośności, natomiast aparaty słuchowe wymagają para-metrów numerycznych. Problem ten można rozwiązać za pomocą logiki rozmytej. W niniejszym referacie przedstawiono metodę przetwarzania rozmytego...
-
Hearing aid fitting method based on fuzzy logic processing
PublikacjaWażnym etapem dopasowania współczesnych aparatów słuchowych jest wyznaczanie charakterystyki dynamiki słuchu. Charakterystyka ta wyznaczana jest na podstawie wyników testu skalowania głośności. Niestety wyniki te wyrażone są w skali kategorii głośności, natomiast aparaty słuchowe wymagają para-metrów numerycznych. Problem ten można rozwiązać za pomocą logiki rozmytej. W niniejszym referacie przedstawiono metodę przetwarzania rozmytego...
-
Identification of regions of interest in video for a traffic monitoring system
PublikacjaA system for automatic event detection in the camera image is presented in this paper. A method of limiting a region of interest to relevant parts of the image using a set of processing procedures is proposed. Image processing includes object detection with shadow removal performed in the modified YCbCr color space instead of RGB. The proposed procedures help to reduce the complexity of image processing algorithm and result in...
-
Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm
PublikacjaW artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...
-
Investigation of the road noise source employing an automatic noise monitoring station
PublikacjaThe paper presents a pilot investigation of noise source models in two selected localizations in the context of future dynamic noise map creation. The experiments were carried out using the automatic noise monitoring station engineered at the Multimedia Systems Departmentof the Gda´nsk University of Technology. The results of the noise measurements employing monitoring stations and its comparison to the reference values are depicted....
-
Investigations of speech signal parameters with regard to articulation influences
PublikacjaW pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublikacjaW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublikacjaW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Modulation frequency constraints on wow and flutter determination
PublikacjaOpracowane wcześniej algorytmy do określania charakterystyki kołysania i drżenia dźwięku okazały się pomocne w rekonstrukcji rzeczywistych próbek dźwiękowych, jednakże przy ich opracowaniu nie określono przedziału częstotliwości modulujących, które mogą być przez nie śledzone. Prezentowany artykuł zawiera studium pozwalające wyznaczyć brakujące przedziały częstotliwości dla trzech algorytmów śledzących: przydźwięk sieciowy, pozostałość...
-
Moving object detection and tracking for the purpose of multimodal surveillance system in urban areas
PublikacjaBackground subtraction method based on mixture of Gaussians was employed to detect all regions in a video frame denoting moving objects. Kalman filters were used for establishing relations between the regions and real moving objects in a scene and for tracking them continuously. The objects were represented by rectangles. The objects coupling with adequate regions including the relation of many-to-many was studied experimentally...
-
MTS pilot tone tracking for "wow" distortion determination
PublikacjaArtykuł przedstawia nowy algorytm do wyznaczania charakterystyki kołysania dźwięku na podstawie śledzenia zmian tonu pilota MTS. Śledzenie zmian częstotliwości nośnej tonu MTS pozwala określić zmienną w czasie głębokość pasożytniczych modulacji częstotliwości będących konsekwencją kołysania. Na tej podstawie tworzona jest charakterystyka zniekształcenia. Proponowany algorytm bazuje na zaproponowanej wcześniej metodzie śledzenie...
-
Multimedia services applied to noise and hearing monitoring and measuring
PublikacjaThe goal of this chapter is to show a research study related to processing of data acquired by the multimedia services engineered at the multimedia systems department (MSD) of the Gdansk University of Technology. This concerns a survey on noise threat employing the multimedia noise monitoring system (MNMS) and hearing tests performed by the "I can hear. . . " system. The obtained results of the noise measurements revealed that...
-
Music information analysis and retrieval - a review
PublikacjaW referacie przedstawiono wybrane zagadnienia związane z analizą i wyszukiwaniem informacji muzycznej. Przegląd ten został oparty na literaturze związanej z dziedziną informatyki muzycznej i koncentruje się wokół problemu parametryzacji dźwięków muzycznych i sygnałów fonicznych oraz analizie przydatności wybranych metod tzw. sztucznej inteligencji (ang. computational intelligence) do akwizycji i rozpoznawania obiektów muzycznych...
-
Music information analysis and retrieval techniques
PublikacjaCelem artykułu jest przedstawienie kluczowych zagadnień gwałtownie rozwijającej się gałęzi multimediów, reprezentowanej przez systemy automatycznego wyszukiwania informacji muzycznej MIR - Music Information Retrieval, która urasta do samodzielnej dziedziny zastosowań w obrębie informatyki muzycznej. W artykule przedstawiono wybrane systemy wyszukiwania informacji muzycznej oraz przedstawiono przykład takiego systemu, zrealizowanego...
-
New generation speech aid for stuttering people
PublikacjaWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
New generation speech aid for stuttering people
PublikacjaWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
Novel approaches to wideband speech coding
PublikacjaDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...
-
Objects classification based on their physical sizes for detection of events in camera images
PublikacjaIn the paper, a method of estimation of the physical sizes of the objects tracked in the video surveillance system, and a simple module for object classification based on the estimated physical sizes, are presented. The results of object classification are then used for automatic detection of various types of events in the camera image.
-
Ocena wpływu zagrożeń hałasowych na częstość występowania chorób słuchu z zastosowaniem systemów teleinformatycznych
Publikacja.
-
On the use of instantaneous complex frequency for pitch and formant tracking.
PublikacjaW pracy opisano algorytm śledzenia częstotliwości podstawowej i formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. Działanie algorytmu przetestowano na nagraniach polskich samogłosek, których wysokość zmieniała się płynnie. Wyniki testów wraz z porównaniem działania opisanej metody i metody predykcji liniowej zawarto w artykule.
-
Personalizacja animacji postaci w aplikacjach rzeczywistości wirtualnej
PublikacjaCelem referatu jest przedstawienie metody tworzenia spersonalizowanej animacji wirtualnej postaci. Na wejściu aplikacji podawane są animacje czynności i gestów, które wzbogacane są o dodatkowe klatki kluczowe. Ma to na celu wprowadzenie do animowanego ruchu elementów nie zmieniających jego obiektywnej treści, ale wpływających na odbiór subiektywny. Parametry dodawanych faz zaleŜne są od subiektywnego opisu...
-
Personalized avatar animation for virtual reality
PublikacjaThe paper presents a method for creating a personalized animation of avatar for virtual reality application such as multiplayer on-line games. Animation is stored in a simplified version, containing only keyframes for important avatar poses. This version defines key movements, i.e. roughly describes the avatar's action. Animation is enriched by the user with new motion phases utilizing fuzzy descriptors.Various degrees of motion...
-
Psychoakustyczna dozymetria hałasowa w multimedialnym systemie monitorowania hałasu
PublikacjaW referacie przedstawiono wyniki działania Psychoakustycznego Dozymetru Hałasowego (PDH). Opracowany algorytm stanowi nowy sposób oceny szkodliwości hałasu. Metoda ta opiera się na wykorzystaniu wiedzy na temat właściwości słuchu dostępnej w literaturze oraz na wynikach badań słuchu i hałasu przeprowadzonych w warunkach laboratoryjnych. Na tej podstawie zaproponowano nowe wskaźniki oceny skumulowanych skutków słuchowych wywołanych...
-
Road noise mapping in the city area: measurements compared to model-based estimations
PublikacjaThe paper presents an approach to the verification of noise prediction models in selected localization in the city of Gdansk. The experiments described include a comparison between environmentalmeasurement results performed in the terrain and the noise level prediction results. The NMPB-96 (Nouvelle Méthode de Prévision du Bruit) and Harmonoise models outcomes provide the subject ofthe analysis. The proposed solution of continuous...
-
Self-adjusting sub-sample delay estimator based on fractional delaying Hilbert transform filter
PublikacjaZaprezentowano nowe rozwiązanie samo-nastrajalnego estymatora opóźnienia sygnału sinusoidalnego, działającego w czasie dyskretnym. Zastosowano filtr Hilberta o skończonej odpowiedzi ipulsowej (FIR od ang. finite impulse response) zagregowany z filtrem ułamkowo-opóźniającym. Zilustrowano performancję estymatora, również w obecności szumu. Przeanalizowano jego złożoność numeryczną.
-
Short review on the design and application of fractionl delay Hilbert transform filter using Farrow structure
PublikacjaThis paper is treated as a brief summary of our hitherto research on the design and utilization of the FDHTF, particularly in the sub-samole delay estimator.
-
Silence/noise detection for speech and music signals
PublikacjaThis paper introduces a novel off-line algorithm for silence/noise detection in noisy signals. The main concept of the proposed algorithm is to provide noise patterns for further signals processing i.e. noise reduction for speech enhancement. The algorithm is based on frequency domain characteristics of signals. The examples of different types of noisy signals are presented.
-
Speech formant frequency and pitch estimation using instantaneous complex frequency
PublikacjaW pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.
-
System for automatic singing voice recognition
PublikacjaW artykule przedstawiono system automatycznego rozpoznawania jakości i typu głosu śpiewaczego. Przedstawiono bazę danych oraz zaimplementowane parametry. Algorytmem decyzyjnym jest algorytm sztucznych sieci neuronowych. Wytrenowany system decyzyjny osiąga skuteczność ok. 90% w obydwu kategoriach rozpoznawania. Dodatkowo wykazano przy pomocy metod statystycznych, że wyniki działania systemu automatycznej oceny jakości technicznej...
-
the assessment of the noise-induced harmful effects based on the properties of human hearing system
PublikacjaA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the human hearing system. The pro-posed method determines the cumulative impact on hearing system produced by the excessive noise. Based on the predicted effects of the noise exposure, the new types of noise indicators were developed. The evaluation of these indicators was...
-
The noise-induced harmful effect assessment based on the properties of the human hearing system
PublikacjaA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the human hearing system. The pro-posed method determines the cumulative impact on hearing system produced by the excessive noise. Based on the predicted effects of the noise exposure, the new types of noise indicators were developed. The evaluation of these indicators was...
-
Zastosowanie modelowania źródła hałasu kolejowego dla polskich pociągów
PublikacjaCelem referatu jest zaprezentowanie wyników implementacji modelu prognozowania źródłowego hałasu kolejowego zawartego w projektach HARMONOISE/IMAGINE, opartego na danych referencyjnych tego modelu. Wyniki prognozowania porównano z wynikami pomiarów przeprowadzonych w warunkach rzeczywistych i na tej podstawie wyznaczono wartości błędów pomiędzy obliczeniami a wartościami pomiarowymi. W modelu przyjęto takie same warunki atmosferyczne,...
-
Zastosowanie reguł rozmytych w komputerowej animacji postaci
PublikacjaPrzedmiotem badawczym rozprawy jest wykazanie możliwości wspomagania komputerowej animacji postaci poprzez wykorzystanie metod inteligentnych, szczególnie logiki rozmytej, w taki sposób, aby możliwe było uzyskiwanie animacji płynnych i nacechowanych stylistycznie, dla których punktem wyjścia są animacje schematyczne, które nie posiadają tych cech. Wiedza zawarta w literaturze animacji i wiedza oparta na wynikach wydobywania danych...
-
Zastosowanie superkomputera do tworzenia dynamicznych map hałasu
PublikacjaW artykule przedstawiono koncepcję i implementację Modelu Dynamicznego Prognozowania Hałasu przeznaczonego do tworzenia map hałasu. Omówiony został cel wykonania powstałej aplikacji. Zawarto krótki opis użytego sprzętu. Omówiono poszczególne elementy Modelu Dynamicznego Prognozowania Hałasu oraz zastosowane metody. Przedstawiono zagadnienia związane z implementacją algorytmów na klastrze komputerowym. Zaprezentowano również rezultaty...
Rok 2007
-
A complex variable fractional-delay FIR filter structure
PublikacjaW artykule wprowadzamy strukturę zespolonego filtru o skończonej odpowiedzi impulsowej (ang. finite impulse response - FIR) ze zmiennym opóźnieniem ułamkowym (ang. fractional delay - FD). Strukturę tę otrzymujemy na podstawie przestrajanego filtru FD FIR o współczynnikach rzeczywistych. Stanowi ona połączenie zbioru liniowo-fazowych filtrów FIR o współczynnikach stałych rzeczywistych i dwóch łańcuchów mnożąco-akumulujących, zawierających...
-
A system for singing training
PublikacjaThe system proposed is aimed at the vocal students and persons who want to improve emission of their voices. The goal is not to substituite a singing teacher but to provide a tool for automatic teaching of voice emission basics. In this way singers can develop their vocal skills and improve them. By a visual feedback a student can control and modify vocal tract maximas (resonances) of a chosen vowel to match the resonances of the...
-
Applying computational intelligence to acoustics.
PublikacjaW artykule przedstawiono przegląd wybranych zagadnień związanych z zastosowaniem metod inteligencji obliczeniowej w akustyce. Zaprezentowane metody obejmują m.in. sztuczne sieci neuronowe, zbiory przyblizone, logikę rozmytą, algorytmy genetyczne. Problematyka akustyczna dotyczy z kolei klasyfikacji dźwięków muzycznych, inteligentnego przetwarzania muzyki, inteligentnego sterowania trakturą organową oraz obiektywizacji metody oceny...
-
Automatic singing voice recognition employing neural networks and rough sets
PublikacjaCelem prac opisanych w referacie jest automatyczne rozpoznawanie głosów śpiewaczych. Do tego celu utworzona została baza nagrań próbek śpiewu profesjonalnego i amatorskiego. Próbki poddane zostały parametryzacji parametrami zaproponowanymi przez autorów ściśle do tego celu. Sposób wyznaczenia parametrów i ich interpretacja fizyczna przedstawione są w referacie. Parametry wprowadzane są do systemów decyzyjnych, klasyfikatorów opartych...
-
Computational intelligence-aided character animation
PublikacjaW pracy przedstawiono pokrótce metody animacji komputerowej, a także podano zasady oceny jakości wyniku animacji postaci. Dodatkowo dokonano przeglądu metod inteligentnych stosowanych w animacji komputerowej i w dziedzinach pokrewnych. W badaniach skupiono się na animacji ruchu w kontekście uzyskiwanej ekspresji. Podano reguły stosowane w animacji tradycyjnej oraz wyznaczono parametry opisujące fazy ruchu w odniesieniu do poszczególnych...
-
Cyfrowy filtr Hilberta i jego zastosowania
PublikacjaZaproponowano efektywne rozwiązanie filtru Hilberta o skończonej odpowiedzi impulsowej i o zmiennym opóźnieniu ułamkowym. Oryginalność polega tu na tym, że filtr równocześnie realizuje filtrację zespoloną Hilberta i opóźnianie ułamkowe wejściowego sygnału o wartościach rzeczywistych. Można go więc zastosować np. w systemie GPS lub w każdym innym systemie, gdzie zachodzi jednocześnie potrzeba filtracji Hilberta i estymacji opóźnienia...
-
Determining the noise impact on hearing using psychoacoustical noise dosimeter
PublikacjaThis research study presents the designed noise dosimeter based on psychoacoustical properties of the human hearing system and, at the same time. evaluation of time and frequency characteristics of noise. The designed noise dosimeter enables assessing temporary threshold shift (TTS) in critical hands in real time. In this way it is possible monitoring the hearing threshold shift continuously for people who stay in the harmful noise...
-
DSP techniques for determining ''Wow'' distortions
PublikacjaArtykuł przedstawia opis algorytmów do wyznaczania charakterystyki zniekształceń kołysania dźwięku. Są to algorytmy: śledzenia przydźwięku sieciowego, śledzenia pozostałości magnetycznej prądu podkładu wielkich częstotliwości, adaptacyjnej analizy środka ciężkości widma dla wybranej części zniekształconego sygnału. Przedstawione algorytmy pozwalają na implementację programową i sprzętową.
-
Estymacja tonu krtaniowego w oparciu o zespoloną pulsację chwilową
PublikacjaW niniejszej pracy zaproponowano nową metodę ekstrakcji tonu krtaniowego w oparciu o zespoloną pulsacjęchwilową - ICF (ang. Instantaneous Complex Frequency). Zaproponowano interaktywny algorytm analizy ICF sygnałumowy, którego wyniki udokumentowano zarówno w dziedzinie czasu (na płaszczyźnie Arganda) jak i w dziedzinieczęstotliwości. Na podstawie osiągniętych wyników wykazano bezpośredni, jednoznaczny związek pomiędzy okresemtonu...
-
Evaluation of Hilbert transform filter performance
PublikacjaW pracy rozpatrzono zagadnienie adaptacyjnej estymacji ułamkowego opóźnienia pomiędzy dwoma sygnałami sinusoidalnymi. Zastosowano tu nowy, zagregowany, zespolony filtr Hilberta, który łączy w sobie funkcje filtracji Hilberta i kompensacji ułamkowego opóźnienia. W eksperymentach wykorzystano efektywną implementację tego filtru w strukturze Farrowa, której jedynym parametrem o zmiennej wartości jest bieżące opóźnienie ułamkowe.
-
Farrow structure for complex digital Hilbert filter of low complexity
PublikacjaW pracy przeanalizowano złożoność numeryczną filtru Hilberta (filtr zespolony), złożonego z pary filtrów cyfrowych o zmiennym opóźnieniu ułamkowym, o strukturze Farrowa. Struktura ta pozwala na zmianę opóźnienia ułamkowego na bieżąco, bez potrzeby każdorazowego przeprojektowywania filtru. Zaproponowano algorytmy/struktury wykorzystujące nie tylko symetrię oryginalnej struktury Farrowa, ale również wspólne elementy opóźniające podfiltrów...
-
Interpolation of complex dynamic trajectory for hand-written signature verification
PublikacjaRożważono problem interpolacji trajektorii jedno-grafelowego podpisu odręcznego do rozpoznawania i weryfikacji podpisu złożonego za pomocą tabletu. Przedyskutowano użyteczność interpolacji celem unifikacji podpisu, dla potrzeb porównania aktualnie złożonego podpisu ze wzorcem zapisanym w bazie. Wykorzystano różne reprezentacje trajektorii. Opracowano system decyzyjny wykorzystujący filtr dopasowany. Pracę zilustrowano przykładami...
-
Monitoring stanu środowiska - nowe szanse technologiczne
PublikacjaNadrzędnym celem projektu realizowanego aktualnie w Katedrze Systemów Multimedialnych Politechniki Gdańskiej jest perspektywiczne ograniczenie częstości występowania chorób słuchu i dolegliwości powodowane nadmiernym hałasem przemysłowym, urbanistycznym oraz skutkami nasilonego ruchu drogowego i zanieczyszczeniem powietrza spalinami. W toku realizacji projektu są wykorzystywane najnowsze technologie teleinformatyczne
-
Multimedia Applications for the Hearing Impaired.
PublikacjaJednym z elementów przeciwdziałania szybko narastającym zagrożeniom niedosłuchem są aplikacje oprate na nowoczesnych technologiach. W wyniku współpracy Katedry Systemów Multimedialnych PG z warszawskim Instytutem Fizjologii i Patologii Słuchu opracowano wdrożone na szeroką skale multimedialne systemy przesiewowych badań zmysłów komunikowania się. Ponadto, nowsze opracowania dotyczą maskowania szumów usznych z wykorzystaniem linearyzacji...
-
Multimedia noise monitoring system
PublikacjaW artykule przedstawiono Multimedialny System Monitorowania Hałasu. Projekt jest sieciocentrycznym systemem dedykowanym monitorowaniu zagrożeń hałasem. Jego nadrzędnym celem jest zwiększenie skuteczności w zakresie profilaktyki chorób słuchu. Umożliwia pobieranie, gromadzenie, analizę i wizualizację danych dotyczących hałasu, pobieranych ze zdalnych urządzeń pomiarowych oraz elektronicznych ankiet dostępnych przez Internet. Ponadto...
-
New generation artificial larynx
PublikacjaCelem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz....
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublikacjaIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej
PublikacjaW pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.
-
Porównanie metod filtracji w dziedzinie widma DFT
PublikacjaW niniejszej pracy zaprezentowano porównanie metod filtracji w dziedzinie częstotliwości,czyli w dziedzinie widma DFT. Opisano i omówiono podstawowe metody filtracji: bez zeropaddingu, z zeropaddingiem oraz metodę Cheh Pana. Pokazane i porównane zostały wyniki eksperymentów dla typowych aplikacji, jakimi są filtr dolnoprzepustowy i filtr różniczkujący.
-
Reprezentacje dynamiczne podpisu odręcznego
PublikacjaZdefiniowano zespolone reprezentacje dynamiczne podpisu składanego odręcznie, zarejestrowanego za pomocą tabletu graficznego. Przedstawiono metody uzyskiwania tych reprezentacji oraz metody wspomagające ocenę zgodności aktualnych podpisów z wzorcem. Omówiono również zalety i wady tych metod. Zaprezentowano wyniki działania oryginalnych algorytmów przetwarzania i podejmowania decyzji, zaimplementowanych w środowisku MATLAB.
-
Searching for metric structure of musical files
PublikacjaCelem opisywanych prac jest porównanie efektywności wybranych metod sztucznej inteligencji w wyznaczaniu rytmu dla zapisu symbolicznego muzyki. Opisano sposób wykorzystania sztucznych sieci neuronowych i zbiorów przybliżonych do poszukiwania właściwej struktury rytmicznej utworu. Analizowane są fizyczne atrybuty dźwięku, które są najbardziej znaczące dla określenia położenia dźwięku na pozycji akcentowanej lub nieakcentowanej....