Publications
Filters
total: 894
Catalog Publications
Year 2008
-
Identification of regions of interest in video for a traffic monitoring system
PublicationA system for automatic event detection in the camera image is presented in this paper. A method of limiting a region of interest to relevant parts of the image using a set of processing procedures is proposed. Image processing includes object detection with shadow removal performed in the modified YCbCr color space instead of RGB. The proposed procedures help to reduce the complexity of image processing algorithm and result in...
-
Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm
PublicationW artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...
-
Investigation of the road noise source employing an automatic noise monitoring station
PublicationThe paper presents a pilot investigation of noise source models in two selected localizations in the context of future dynamic noise map creation. The experiments were carried out using the automatic noise monitoring station engineered at the Multimedia Systems Departmentof the Gda´nsk University of Technology. The results of the noise measurements employing monitoring stations and its comparison to the reference values are depicted....
-
Investigations of speech signal parameters with regard to articulation influences
PublicationW pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Modulation frequency constraints on wow and flutter determination
PublicationOpracowane wcześniej algorytmy do określania charakterystyki kołysania i drżenia dźwięku okazały się pomocne w rekonstrukcji rzeczywistych próbek dźwiękowych, jednakże przy ich opracowaniu nie określono przedziału częstotliwości modulujących, które mogą być przez nie śledzone. Prezentowany artykuł zawiera studium pozwalające wyznaczyć brakujące przedziały częstotliwości dla trzech algorytmów śledzących: przydźwięk sieciowy, pozostałość...
-
Moving object detection and tracking for the purpose of multimodal surveillance system in urban areas
PublicationBackground subtraction method based on mixture of Gaussians was employed to detect all regions in a video frame denoting moving objects. Kalman filters were used for establishing relations between the regions and real moving objects in a scene and for tracking them continuously. The objects were represented by rectangles. The objects coupling with adequate regions including the relation of many-to-many was studied experimentally...
-
MTS pilot tone tracking for "wow" distortion determination
PublicationArtykuł przedstawia nowy algorytm do wyznaczania charakterystyki kołysania dźwięku na podstawie śledzenia zmian tonu pilota MTS. Śledzenie zmian częstotliwości nośnej tonu MTS pozwala określić zmienną w czasie głębokość pasożytniczych modulacji częstotliwości będących konsekwencją kołysania. Na tej podstawie tworzona jest charakterystyka zniekształcenia. Proponowany algorytm bazuje na zaproponowanej wcześniej metodzie śledzenie...
-
Multimedia services applied to noise and hearing monitoring and measuring
PublicationThe goal of this chapter is to show a research study related to processing of data acquired by the multimedia services engineered at the multimedia systems department (MSD) of the Gdansk University of Technology. This concerns a survey on noise threat employing the multimedia noise monitoring system (MNMS) and hearing tests performed by the "I can hear. . . " system. The obtained results of the noise measurements revealed that...
-
Music information analysis and retrieval - a review
PublicationW referacie przedstawiono wybrane zagadnienia związane z analizą i wyszukiwaniem informacji muzycznej. Przegląd ten został oparty na literaturze związanej z dziedziną informatyki muzycznej i koncentruje się wokół problemu parametryzacji dźwięków muzycznych i sygnałów fonicznych oraz analizie przydatności wybranych metod tzw. sztucznej inteligencji (ang. computational intelligence) do akwizycji i rozpoznawania obiektów muzycznych...
-
Music information analysis and retrieval techniques
PublicationCelem artykułu jest przedstawienie kluczowych zagadnień gwałtownie rozwijającej się gałęzi multimediów, reprezentowanej przez systemy automatycznego wyszukiwania informacji muzycznej MIR - Music Information Retrieval, która urasta do samodzielnej dziedziny zastosowań w obrębie informatyki muzycznej. W artykule przedstawiono wybrane systemy wyszukiwania informacji muzycznej oraz przedstawiono przykład takiego systemu, zrealizowanego...
-
New generation speech aid for stuttering people
PublicationWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
New generation speech aid for stuttering people
PublicationWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
Novel approaches to wideband speech coding
PublicationDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...
-
Objects classification based on their physical sizes for detection of events in camera images
PublicationIn the paper, a method of estimation of the physical sizes of the objects tracked in the video surveillance system, and a simple module for object classification based on the estimated physical sizes, are presented. The results of object classification are then used for automatic detection of various types of events in the camera image.
-
Ocena wpływu zagrożeń hałasowych na częstość występowania chorób słuchu z zastosowaniem systemów teleinformatycznych
Publication.
-
On the use of instantaneous complex frequency for pitch and formant tracking.
PublicationW pracy opisano algorytm śledzenia częstotliwości podstawowej i formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. Działanie algorytmu przetestowano na nagraniach polskich samogłosek, których wysokość zmieniała się płynnie. Wyniki testów wraz z porównaniem działania opisanej metody i metody predykcji liniowej zawarto w artykule.
-
Personalizacja animacji postaci w aplikacjach rzeczywistości wirtualnej
PublicationCelem referatu jest przedstawienie metody tworzenia spersonalizowanej animacji wirtualnej postaci. Na wejściu aplikacji podawane są animacje czynności i gestów, które wzbogacane są o dodatkowe klatki kluczowe. Ma to na celu wprowadzenie do animowanego ruchu elementów nie zmieniających jego obiektywnej treści, ale wpływających na odbiór subiektywny. Parametry dodawanych faz zaleŜne są od subiektywnego opisu...
-
Personalized avatar animation for virtual reality
PublicationThe paper presents a method for creating a personalized animation of avatar for virtual reality application such as multiplayer on-line games. Animation is stored in a simplified version, containing only keyframes for important avatar poses. This version defines key movements, i.e. roughly describes the avatar's action. Animation is enriched by the user with new motion phases utilizing fuzzy descriptors.Various degrees of motion...
-
Psychoakustyczna dozymetria hałasowa w multimedialnym systemie monitorowania hałasu
PublicationW referacie przedstawiono wyniki działania Psychoakustycznego Dozymetru Hałasowego (PDH). Opracowany algorytm stanowi nowy sposób oceny szkodliwości hałasu. Metoda ta opiera się na wykorzystaniu wiedzy na temat właściwości słuchu dostępnej w literaturze oraz na wynikach badań słuchu i hałasu przeprowadzonych w warunkach laboratoryjnych. Na tej podstawie zaproponowano nowe wskaźniki oceny skumulowanych skutków słuchowych wywołanych...
-
Road noise mapping in the city area: measurements compared to model-based estimations
PublicationThe paper presents an approach to the verification of noise prediction models in selected localization in the city of Gdansk. The experiments described include a comparison between environmentalmeasurement results performed in the terrain and the noise level prediction results. The NMPB-96 (Nouvelle Méthode de Prévision du Bruit) and Harmonoise models outcomes provide the subject ofthe analysis. The proposed solution of continuous...
-
Self-adjusting sub-sample delay estimator based on fractional delaying Hilbert transform filter
PublicationZaprezentowano nowe rozwiązanie samo-nastrajalnego estymatora opóźnienia sygnału sinusoidalnego, działającego w czasie dyskretnym. Zastosowano filtr Hilberta o skończonej odpowiedzi ipulsowej (FIR od ang. finite impulse response) zagregowany z filtrem ułamkowo-opóźniającym. Zilustrowano performancję estymatora, również w obecności szumu. Przeanalizowano jego złożoność numeryczną.
-
Short review on the design and application of fractionl delay Hilbert transform filter using Farrow structure
PublicationThis paper is treated as a brief summary of our hitherto research on the design and utilization of the FDHTF, particularly in the sub-samole delay estimator.
-
Silence/noise detection for speech and music signals
PublicationThis paper introduces a novel off-line algorithm for silence/noise detection in noisy signals. The main concept of the proposed algorithm is to provide noise patterns for further signals processing i.e. noise reduction for speech enhancement. The algorithm is based on frequency domain characteristics of signals. The examples of different types of noisy signals are presented.
-
Speech formant frequency and pitch estimation using instantaneous complex frequency
PublicationW pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.
-
System for automatic singing voice recognition
PublicationW artykule przedstawiono system automatycznego rozpoznawania jakości i typu głosu śpiewaczego. Przedstawiono bazę danych oraz zaimplementowane parametry. Algorytmem decyzyjnym jest algorytm sztucznych sieci neuronowych. Wytrenowany system decyzyjny osiąga skuteczność ok. 90% w obydwu kategoriach rozpoznawania. Dodatkowo wykazano przy pomocy metod statystycznych, że wyniki działania systemu automatycznej oceny jakości technicznej...
-
the assessment of the noise-induced harmful effects based on the properties of human hearing system
PublicationA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the human hearing system. The pro-posed method determines the cumulative impact on hearing system produced by the excessive noise. Based on the predicted effects of the noise exposure, the new types of noise indicators were developed. The evaluation of these indicators was...
-
The noise-induced harmful effect assessment based on the properties of the human hearing system
PublicationA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the human hearing system. The pro-posed method determines the cumulative impact on hearing system produced by the excessive noise. Based on the predicted effects of the noise exposure, the new types of noise indicators were developed. The evaluation of these indicators was...
-
Zastosowanie modelowania źródła hałasu kolejowego dla polskich pociągów
PublicationCelem referatu jest zaprezentowanie wyników implementacji modelu prognozowania źródłowego hałasu kolejowego zawartego w projektach HARMONOISE/IMAGINE, opartego na danych referencyjnych tego modelu. Wyniki prognozowania porównano z wynikami pomiarów przeprowadzonych w warunkach rzeczywistych i na tej podstawie wyznaczono wartości błędów pomiędzy obliczeniami a wartościami pomiarowymi. W modelu przyjęto takie same warunki atmosferyczne,...
-
Zastosowanie reguł rozmytych w komputerowej animacji postaci
PublicationPrzedmiotem badawczym rozprawy jest wykazanie możliwości wspomagania komputerowej animacji postaci poprzez wykorzystanie metod inteligentnych, szczególnie logiki rozmytej, w taki sposób, aby możliwe było uzyskiwanie animacji płynnych i nacechowanych stylistycznie, dla których punktem wyjścia są animacje schematyczne, które nie posiadają tych cech. Wiedza zawarta w literaturze animacji i wiedza oparta na wynikach wydobywania danych...
-
Zastosowanie superkomputera do tworzenia dynamicznych map hałasu
PublicationW artykule przedstawiono koncepcję i implementację Modelu Dynamicznego Prognozowania Hałasu przeznaczonego do tworzenia map hałasu. Omówiony został cel wykonania powstałej aplikacji. Zawarto krótki opis użytego sprzętu. Omówiono poszczególne elementy Modelu Dynamicznego Prognozowania Hałasu oraz zastosowane metody. Przedstawiono zagadnienia związane z implementacją algorytmów na klastrze komputerowym. Zaprezentowano również rezultaty...
Year 2007
-
A complex variable fractional-delay FIR filter structure
PublicationW artykule wprowadzamy strukturę zespolonego filtru o skończonej odpowiedzi impulsowej (ang. finite impulse response - FIR) ze zmiennym opóźnieniem ułamkowym (ang. fractional delay - FD). Strukturę tę otrzymujemy na podstawie przestrajanego filtru FD FIR o współczynnikach rzeczywistych. Stanowi ona połączenie zbioru liniowo-fazowych filtrów FIR o współczynnikach stałych rzeczywistych i dwóch łańcuchów mnożąco-akumulujących, zawierających...
-
A system for singing training
PublicationThe system proposed is aimed at the vocal students and persons who want to improve emission of their voices. The goal is not to substituite a singing teacher but to provide a tool for automatic teaching of voice emission basics. In this way singers can develop their vocal skills and improve them. By a visual feedback a student can control and modify vocal tract maximas (resonances) of a chosen vowel to match the resonances of the...
-
Applying computational intelligence to acoustics.
PublicationW artykule przedstawiono przegląd wybranych zagadnień związanych z zastosowaniem metod inteligencji obliczeniowej w akustyce. Zaprezentowane metody obejmują m.in. sztuczne sieci neuronowe, zbiory przyblizone, logikę rozmytą, algorytmy genetyczne. Problematyka akustyczna dotyczy z kolei klasyfikacji dźwięków muzycznych, inteligentnego przetwarzania muzyki, inteligentnego sterowania trakturą organową oraz obiektywizacji metody oceny...
-
Automatic singing voice recognition employing neural networks and rough sets
PublicationCelem prac opisanych w referacie jest automatyczne rozpoznawanie głosów śpiewaczych. Do tego celu utworzona została baza nagrań próbek śpiewu profesjonalnego i amatorskiego. Próbki poddane zostały parametryzacji parametrami zaproponowanymi przez autorów ściśle do tego celu. Sposób wyznaczenia parametrów i ich interpretacja fizyczna przedstawione są w referacie. Parametry wprowadzane są do systemów decyzyjnych, klasyfikatorów opartych...
-
Computational intelligence-aided character animation
PublicationW pracy przedstawiono pokrótce metody animacji komputerowej, a także podano zasady oceny jakości wyniku animacji postaci. Dodatkowo dokonano przeglądu metod inteligentnych stosowanych w animacji komputerowej i w dziedzinach pokrewnych. W badaniach skupiono się na animacji ruchu w kontekście uzyskiwanej ekspresji. Podano reguły stosowane w animacji tradycyjnej oraz wyznaczono parametry opisujące fazy ruchu w odniesieniu do poszczególnych...
-
Cyfrowy filtr Hilberta i jego zastosowania
PublicationZaproponowano efektywne rozwiązanie filtru Hilberta o skończonej odpowiedzi impulsowej i o zmiennym opóźnieniu ułamkowym. Oryginalność polega tu na tym, że filtr równocześnie realizuje filtrację zespoloną Hilberta i opóźnianie ułamkowe wejściowego sygnału o wartościach rzeczywistych. Można go więc zastosować np. w systemie GPS lub w każdym innym systemie, gdzie zachodzi jednocześnie potrzeba filtracji Hilberta i estymacji opóźnienia...
-
Determining the noise impact on hearing using psychoacoustical noise dosimeter
PublicationThis research study presents the designed noise dosimeter based on psychoacoustical properties of the human hearing system and, at the same time. evaluation of time and frequency characteristics of noise. The designed noise dosimeter enables assessing temporary threshold shift (TTS) in critical hands in real time. In this way it is possible monitoring the hearing threshold shift continuously for people who stay in the harmful noise...
-
DSP techniques for determining ''Wow'' distortions
PublicationArtykuł przedstawia opis algorytmów do wyznaczania charakterystyki zniekształceń kołysania dźwięku. Są to algorytmy: śledzenia przydźwięku sieciowego, śledzenia pozostałości magnetycznej prądu podkładu wielkich częstotliwości, adaptacyjnej analizy środka ciężkości widma dla wybranej części zniekształconego sygnału. Przedstawione algorytmy pozwalają na implementację programową i sprzętową.
-
Estymacja tonu krtaniowego w oparciu o zespoloną pulsację chwilową
PublicationW niniejszej pracy zaproponowano nową metodę ekstrakcji tonu krtaniowego w oparciu o zespoloną pulsacjęchwilową - ICF (ang. Instantaneous Complex Frequency). Zaproponowano interaktywny algorytm analizy ICF sygnałumowy, którego wyniki udokumentowano zarówno w dziedzinie czasu (na płaszczyźnie Arganda) jak i w dziedzinieczęstotliwości. Na podstawie osiągniętych wyników wykazano bezpośredni, jednoznaczny związek pomiędzy okresemtonu...
-
Evaluation of Hilbert transform filter performance
PublicationW pracy rozpatrzono zagadnienie adaptacyjnej estymacji ułamkowego opóźnienia pomiędzy dwoma sygnałami sinusoidalnymi. Zastosowano tu nowy, zagregowany, zespolony filtr Hilberta, który łączy w sobie funkcje filtracji Hilberta i kompensacji ułamkowego opóźnienia. W eksperymentach wykorzystano efektywną implementację tego filtru w strukturze Farrowa, której jedynym parametrem o zmiennej wartości jest bieżące opóźnienie ułamkowe.
-
Farrow structure for complex digital Hilbert filter of low complexity
PublicationW pracy przeanalizowano złożoność numeryczną filtru Hilberta (filtr zespolony), złożonego z pary filtrów cyfrowych o zmiennym opóźnieniu ułamkowym, o strukturze Farrowa. Struktura ta pozwala na zmianę opóźnienia ułamkowego na bieżąco, bez potrzeby każdorazowego przeprojektowywania filtru. Zaproponowano algorytmy/struktury wykorzystujące nie tylko symetrię oryginalnej struktury Farrowa, ale również wspólne elementy opóźniające podfiltrów...
-
Interpolation of complex dynamic trajectory for hand-written signature verification
PublicationRożważono problem interpolacji trajektorii jedno-grafelowego podpisu odręcznego do rozpoznawania i weryfikacji podpisu złożonego za pomocą tabletu. Przedyskutowano użyteczność interpolacji celem unifikacji podpisu, dla potrzeb porównania aktualnie złożonego podpisu ze wzorcem zapisanym w bazie. Wykorzystano różne reprezentacje trajektorii. Opracowano system decyzyjny wykorzystujący filtr dopasowany. Pracę zilustrowano przykładami...
-
Monitoring stanu środowiska - nowe szanse technologiczne
PublicationNadrzędnym celem projektu realizowanego aktualnie w Katedrze Systemów Multimedialnych Politechniki Gdańskiej jest perspektywiczne ograniczenie częstości występowania chorób słuchu i dolegliwości powodowane nadmiernym hałasem przemysłowym, urbanistycznym oraz skutkami nasilonego ruchu drogowego i zanieczyszczeniem powietrza spalinami. W toku realizacji projektu są wykorzystywane najnowsze technologie teleinformatyczne
-
Multimedia Applications for the Hearing Impaired.
PublicationJednym z elementów przeciwdziałania szybko narastającym zagrożeniom niedosłuchem są aplikacje oprate na nowoczesnych technologiach. W wyniku współpracy Katedry Systemów Multimedialnych PG z warszawskim Instytutem Fizjologii i Patologii Słuchu opracowano wdrożone na szeroką skale multimedialne systemy przesiewowych badań zmysłów komunikowania się. Ponadto, nowsze opracowania dotyczą maskowania szumów usznych z wykorzystaniem linearyzacji...
-
Multimedia noise monitoring system
PublicationW artykule przedstawiono Multimedialny System Monitorowania Hałasu. Projekt jest sieciocentrycznym systemem dedykowanym monitorowaniu zagrożeń hałasem. Jego nadrzędnym celem jest zwiększenie skuteczności w zakresie profilaktyki chorób słuchu. Umożliwia pobieranie, gromadzenie, analizę i wizualizację danych dotyczących hałasu, pobieranych ze zdalnych urządzeń pomiarowych oraz elektronicznych ankiet dostępnych przez Internet. Ponadto...
-
New generation artificial larynx
PublicationCelem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz....
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublicationIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej
PublicationW pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.