Publications
Filters
total: 908
Catalog Publications
Year 2008
-
A recursive multi-output dicrete-time sinusoidal oscillator
PublicationZaproponowano wielo-wyjściowy cyfrowy oscylator sinusoidalny. Przedstawiono performancję tego oscylatora. Oscylator generuje sinusoidy: o zadanych fazach początkowych i o jednostkowej amplitudzie, przy użyciu algorytmów rekursywnych. Wprowadzona tu macierz rotacji zespolonego oscylatora unifikuje różne struktury zespolonych oscylatorów i pozwala na wprowadzenie nowych struktur trójfazowych, cztero-fazowych i ogólnie wielo-fazowych...
-
Automatic detection and correction of detuned singing system for use with query-by-humming applications
PublicationThe aim of the paper is to present an idea of using the automatic detection and correction of detuned singing as a subsystem in query-by-humming (QBH) applications. The common approach to searching for a requested song basing on the melody retrieved from hummed pattern usually employs the so-called Parsons code or melody contour. In such a case information about sound pitch is discarded. It was thought out that an additional module...
-
Automatic detection and correction of detuned singing system for use with query-by-humming applications
PublicationThe aim of the paper is to present an idea of using the automatic detection and correction of detuned singing as a subsystem in query-by-humming (QBH) applications. The common approach to searching for a requested song basing on the melody retrieved from hummed pattern usually employs the so-called Parsons code or melody contour. In such a case information about sound pitch is discarded. It was thought out that an additional module...
-
Automatic Rhythm Retrieval from Musical Files
PublicationThis paper presents a comparison of the effectiveness of two computational intelligence approaches applied to the task of retrieving rhythmic structure from musical files. The method proposed by the authors of this paper generates rhythmic levels first, and then uses these levels to compose rhythmic hypotheses. Three phases: creating periods, creating simplified hypotheses and creating full hypotheses are examined within this study....
-
Automatic singing quality recognition employing artificial neural networks
PublicationCelem artykułu jest udowodnienie możliwości automatycznej oceny jakości technicznej głosów śpiewaczych. Pokrótce zaprezentowano w nim stworzoną bazę danych głosów śpiewaczych oraz zaimplementowane parametry. Przy pomocy sztucznych sieci neuronowych zaprojektowano system decyzyjny, który oceniono w pięciostopniowej skali jakość techniczną głosu. Przy pomocy metod statystycznych udowodniono, że wyniki generowane przez ten system...
-
Automatic Singing Voice Recognition EmployingNeural Networks and Rough Sets
PublicationCelem badań jest automatyczne rozpoznawanie głosów śpiewaczych w kategorii rodzaju i jakości technicznej śpiewu. W artykule opisano stworzoną bazę danych głosów, która zawiera próbki głosu śpiewaków profesjonalnych i amatorskich. W dalszej części opisano parametry zdefiniowane w oparciu o zjawiska biomechaniczne w narządzie głosu podczas śpiewania. W oparciu o stworzone macierze parametrów wytrenowano i porównano automatyczne klasyfikatory...
-
Automatic sound recognition for security purposes
PublicationIn the paper an automatic sound recognition system is presented. It forms a part of a bigger security system developed in order to monitor outdoor places for non-typical audio-visual events. The analyzed audio signal is being recorded from a microphone mounted in an outdoor place thus a non stationary noise of a significant energy is present in it. In the paper an especially designed algorithm for outdoor noise reduction is presented,...
-
Automatic system for audio-video material reconstruction and archiving
PublicationReferat przedstawia propozycję modelu systemu automatycznej archiwizacji i rekonstrukcji nagrań audio-wideo. Założeniem tego rozwiązania jest uczynienie procesu rekonstrukcji nagrań bardziej niezależnym od człowieka. Ma to na celu redukcję kosztów rekonstrukcji przetwarzanych nagrań. Z powodu dużej liczby archiwalnych nagrań audio-wideo istnieje potrzeba stworzenia systemu który umożliwi automatyczną indeksację ich treści. Pomoże...
-
Comparison of developed gaze point estimation methods
PublicationThis paper presents the software part of an inexpensive hands-free eye tracking system. The system works using infrared illumination like most of the available eye trackers. Two methods allowing estimation the gaze point on computer screen are compared. Research on effectiveness of these methods is discussed and the better one is indicated.
-
Drift, wow and flutter measurement and reduction in shrunken movie soundtracks
PublicationReferat przedstawia metodę i algorytmy do oceny i redukcji dryfu, kołysania i drżenia w skurczonych taśmach filmowych. Przedstawione algorytmy działają w oparciu o przetwarzaniu obrazu taśmy filmowej w celu wyznaczenia jej lokalnego skurczu, który jest jednym z powodów powstawania dryfu, kołysania i drżenia. Lokalny skurcz taśmy można wyznaczyć dzięki analizie wysokości: ramki obrazu, perforacji, lub innego, standaryzowanego elementu...
-
efficient fractional delay hilbert transform filter in the farrow structure
PublicationIn this paper the design and application of a Fractional Delay Hilbert Transform Filter (FDHTF) into an adaptive sub-sample delay estimation between two separated sinusoidal signals is considered. The FDHTF incorporates the functions of Hilbertian and variable fractional delay filtering of the incoming signal simultaneously, in one stage. In traditional approach each of these operations was performed separately. Obtained value...
-
Evaluation of excessive noise effects on hearing employing psychoacoustic dosimetry
PublicationResearch results regarding the noise impact on hearing applying the concept of the Psychoacoustic Noise Dosimetry (PND) are presented. The general characteristics of the PND algorithm are discussed. Additionally, the results of hearing examinations conducted in the laboratory conditions are shown. The main objective of the research was to determine the time needed for the Temporary Threshold Shift to reverse. The results were used...
-
Hearing aid fitting method based on fuzzy logic processing
PublicationWażnym etapem dopasowania współczesnych aparatów słuchowych jest wyznaczanie charakterystyki dynamiki słuchu. Charakterystyka ta wyznaczana jest na podstawie wyników testu skalowania głośności. Niestety wyniki te wyrażone są w skali kategorii głośności, natomiast aparaty słuchowe wymagają para-metrów numerycznych. Problem ten można rozwiązać za pomocą logiki rozmytej. W niniejszym referacie przedstawiono metodę przetwarzania rozmytego...
-
Hearing aid fitting method based on fuzzy logic processing
PublicationWażnym etapem dopasowania współczesnych aparatów słuchowych jest wyznaczanie charakterystyki dynamiki słuchu. Charakterystyka ta wyznaczana jest na podstawie wyników testu skalowania głośności. Niestety wyniki te wyrażone są w skali kategorii głośności, natomiast aparaty słuchowe wymagają para-metrów numerycznych. Problem ten można rozwiązać za pomocą logiki rozmytej. W niniejszym referacie przedstawiono metodę przetwarzania rozmytego...
-
Identification of regions of interest in video for a traffic monitoring system
PublicationA system for automatic event detection in the camera image is presented in this paper. A method of limiting a region of interest to relevant parts of the image using a set of processing procedures is proposed. Image processing includes object detection with shadow removal performed in the modified YCbCr color space instead of RGB. The proposed procedures help to reduce the complexity of image processing algorithm and result in...
-
Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm
PublicationW artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...
-
Investigation of the road noise source employing an automatic noise monitoring station
PublicationThe paper presents a pilot investigation of noise source models in two selected localizations in the context of future dynamic noise map creation. The experiments were carried out using the automatic noise monitoring station engineered at the Multimedia Systems Departmentof the Gda´nsk University of Technology. The results of the noise measurements employing monitoring stations and its comparison to the reference values are depicted....
-
Investigations of speech signal parameters with regard to articulation influences
PublicationW pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Modulation frequency constraints on wow and flutter determination
PublicationOpracowane wcześniej algorytmy do określania charakterystyki kołysania i drżenia dźwięku okazały się pomocne w rekonstrukcji rzeczywistych próbek dźwiękowych, jednakże przy ich opracowaniu nie określono przedziału częstotliwości modulujących, które mogą być przez nie śledzone. Prezentowany artykuł zawiera studium pozwalające wyznaczyć brakujące przedziały częstotliwości dla trzech algorytmów śledzących: przydźwięk sieciowy, pozostałość...
-
Moving object detection and tracking for the purpose of multimodal surveillance system in urban areas
PublicationBackground subtraction method based on mixture of Gaussians was employed to detect all regions in a video frame denoting moving objects. Kalman filters were used for establishing relations between the regions and real moving objects in a scene and for tracking them continuously. The objects were represented by rectangles. The objects coupling with adequate regions including the relation of many-to-many was studied experimentally...
-
MTS pilot tone tracking for "wow" distortion determination
PublicationArtykuł przedstawia nowy algorytm do wyznaczania charakterystyki kołysania dźwięku na podstawie śledzenia zmian tonu pilota MTS. Śledzenie zmian częstotliwości nośnej tonu MTS pozwala określić zmienną w czasie głębokość pasożytniczych modulacji częstotliwości będących konsekwencją kołysania. Na tej podstawie tworzona jest charakterystyka zniekształcenia. Proponowany algorytm bazuje na zaproponowanej wcześniej metodzie śledzenie...
-
Multimedia services applied to noise and hearing monitoring and measuring
PublicationThe goal of this chapter is to show a research study related to processing of data acquired by the multimedia services engineered at the multimedia systems department (MSD) of the Gdansk University of Technology. This concerns a survey on noise threat employing the multimedia noise monitoring system (MNMS) and hearing tests performed by the "I can hear. . . " system. The obtained results of the noise measurements revealed that...
-
Music information analysis and retrieval - a review
PublicationW referacie przedstawiono wybrane zagadnienia związane z analizą i wyszukiwaniem informacji muzycznej. Przegląd ten został oparty na literaturze związanej z dziedziną informatyki muzycznej i koncentruje się wokół problemu parametryzacji dźwięków muzycznych i sygnałów fonicznych oraz analizie przydatności wybranych metod tzw. sztucznej inteligencji (ang. computational intelligence) do akwizycji i rozpoznawania obiektów muzycznych...
-
Music information analysis and retrieval techniques
PublicationCelem artykułu jest przedstawienie kluczowych zagadnień gwałtownie rozwijającej się gałęzi multimediów, reprezentowanej przez systemy automatycznego wyszukiwania informacji muzycznej MIR - Music Information Retrieval, która urasta do samodzielnej dziedziny zastosowań w obrębie informatyki muzycznej. W artykule przedstawiono wybrane systemy wyszukiwania informacji muzycznej oraz przedstawiono przykład takiego systemu, zrealizowanego...
-
New generation speech aid for stuttering people
PublicationWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
New generation speech aid for stuttering people
PublicationWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
Novel approaches to wideband speech coding
PublicationDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...
-
Objects classification based on their physical sizes for detection of events in camera images
PublicationIn the paper, a method of estimation of the physical sizes of the objects tracked in the video surveillance system, and a simple module for object classification based on the estimated physical sizes, are presented. The results of object classification are then used for automatic detection of various types of events in the camera image.
-
Ocena wpływu zagrożeń hałasowych na częstość występowania chorób słuchu z zastosowaniem systemów teleinformatycznych
Publication.
-
On the use of instantaneous complex frequency for pitch and formant tracking.
PublicationW pracy opisano algorytm śledzenia częstotliwości podstawowej i formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. Działanie algorytmu przetestowano na nagraniach polskich samogłosek, których wysokość zmieniała się płynnie. Wyniki testów wraz z porównaniem działania opisanej metody i metody predykcji liniowej zawarto w artykule.
-
Personalizacja animacji postaci w aplikacjach rzeczywistości wirtualnej
PublicationCelem referatu jest przedstawienie metody tworzenia spersonalizowanej animacji wirtualnej postaci. Na wejściu aplikacji podawane są animacje czynności i gestów, które wzbogacane są o dodatkowe klatki kluczowe. Ma to na celu wprowadzenie do animowanego ruchu elementów nie zmieniających jego obiektywnej treści, ale wpływających na odbiór subiektywny. Parametry dodawanych faz zaleŜne są od subiektywnego opisu...
-
Personalized avatar animation for virtual reality
PublicationThe paper presents a method for creating a personalized animation of avatar for virtual reality application such as multiplayer on-line games. Animation is stored in a simplified version, containing only keyframes for important avatar poses. This version defines key movements, i.e. roughly describes the avatar's action. Animation is enriched by the user with new motion phases utilizing fuzzy descriptors.Various degrees of motion...
-
Psychoakustyczna dozymetria hałasowa w multimedialnym systemie monitorowania hałasu
PublicationW referacie przedstawiono wyniki działania Psychoakustycznego Dozymetru Hałasowego (PDH). Opracowany algorytm stanowi nowy sposób oceny szkodliwości hałasu. Metoda ta opiera się na wykorzystaniu wiedzy na temat właściwości słuchu dostępnej w literaturze oraz na wynikach badań słuchu i hałasu przeprowadzonych w warunkach laboratoryjnych. Na tej podstawie zaproponowano nowe wskaźniki oceny skumulowanych skutków słuchowych wywołanych...
-
Road noise mapping in the city area: measurements compared to model-based estimations
PublicationThe paper presents an approach to the verification of noise prediction models in selected localization in the city of Gdansk. The experiments described include a comparison between environmentalmeasurement results performed in the terrain and the noise level prediction results. The NMPB-96 (Nouvelle Méthode de Prévision du Bruit) and Harmonoise models outcomes provide the subject ofthe analysis. The proposed solution of continuous...
-
Self-adjusting sub-sample delay estimator based on fractional delaying Hilbert transform filter
PublicationZaprezentowano nowe rozwiązanie samo-nastrajalnego estymatora opóźnienia sygnału sinusoidalnego, działającego w czasie dyskretnym. Zastosowano filtr Hilberta o skończonej odpowiedzi ipulsowej (FIR od ang. finite impulse response) zagregowany z filtrem ułamkowo-opóźniającym. Zilustrowano performancję estymatora, również w obecności szumu. Przeanalizowano jego złożoność numeryczną.
-
Short review on the design and application of fractionl delay Hilbert transform filter using Farrow structure
PublicationThis paper is treated as a brief summary of our hitherto research on the design and utilization of the FDHTF, particularly in the sub-samole delay estimator.
-
Silence/noise detection for speech and music signals
PublicationThis paper introduces a novel off-line algorithm for silence/noise detection in noisy signals. The main concept of the proposed algorithm is to provide noise patterns for further signals processing i.e. noise reduction for speech enhancement. The algorithm is based on frequency domain characteristics of signals. The examples of different types of noisy signals are presented.
-
Speech formant frequency and pitch estimation using instantaneous complex frequency
PublicationW pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.
-
System for automatic singing voice recognition
PublicationW artykule przedstawiono system automatycznego rozpoznawania jakości i typu głosu śpiewaczego. Przedstawiono bazę danych oraz zaimplementowane parametry. Algorytmem decyzyjnym jest algorytm sztucznych sieci neuronowych. Wytrenowany system decyzyjny osiąga skuteczność ok. 90% w obydwu kategoriach rozpoznawania. Dodatkowo wykazano przy pomocy metod statystycznych, że wyniki działania systemu automatycznej oceny jakości technicznej...
-
the assessment of the noise-induced harmful effects based on the properties of human hearing system
PublicationA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the human hearing system. The pro-posed method determines the cumulative impact on hearing system produced by the excessive noise. Based on the predicted effects of the noise exposure, the new types of noise indicators were developed. The evaluation of these indicators was...
-
The noise-induced harmful effect assessment based on the properties of the human hearing system
PublicationA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the human hearing system. The pro-posed method determines the cumulative impact on hearing system produced by the excessive noise. Based on the predicted effects of the noise exposure, the new types of noise indicators were developed. The evaluation of these indicators was...
-
Zastosowanie modelowania źródła hałasu kolejowego dla polskich pociągów
PublicationCelem referatu jest zaprezentowanie wyników implementacji modelu prognozowania źródłowego hałasu kolejowego zawartego w projektach HARMONOISE/IMAGINE, opartego na danych referencyjnych tego modelu. Wyniki prognozowania porównano z wynikami pomiarów przeprowadzonych w warunkach rzeczywistych i na tej podstawie wyznaczono wartości błędów pomiędzy obliczeniami a wartościami pomiarowymi. W modelu przyjęto takie same warunki atmosferyczne,...
-
Zastosowanie reguł rozmytych w komputerowej animacji postaci
PublicationPrzedmiotem badawczym rozprawy jest wykazanie możliwości wspomagania komputerowej animacji postaci poprzez wykorzystanie metod inteligentnych, szczególnie logiki rozmytej, w taki sposób, aby możliwe było uzyskiwanie animacji płynnych i nacechowanych stylistycznie, dla których punktem wyjścia są animacje schematyczne, które nie posiadają tych cech. Wiedza zawarta w literaturze animacji i wiedza oparta na wynikach wydobywania danych...
-
Zastosowanie superkomputera do tworzenia dynamicznych map hałasu
PublicationW artykule przedstawiono koncepcję i implementację Modelu Dynamicznego Prognozowania Hałasu przeznaczonego do tworzenia map hałasu. Omówiony został cel wykonania powstałej aplikacji. Zawarto krótki opis użytego sprzętu. Omówiono poszczególne elementy Modelu Dynamicznego Prognozowania Hałasu oraz zastosowane metody. Przedstawiono zagadnienia związane z implementacją algorytmów na klastrze komputerowym. Zaprezentowano również rezultaty...
Year 2007
-
A complex variable fractional-delay FIR filter structure
PublicationW artykule wprowadzamy strukturę zespolonego filtru o skończonej odpowiedzi impulsowej (ang. finite impulse response - FIR) ze zmiennym opóźnieniem ułamkowym (ang. fractional delay - FD). Strukturę tę otrzymujemy na podstawie przestrajanego filtru FD FIR o współczynnikach rzeczywistych. Stanowi ona połączenie zbioru liniowo-fazowych filtrów FIR o współczynnikach stałych rzeczywistych i dwóch łańcuchów mnożąco-akumulujących, zawierających...
-
A system for singing training
PublicationThe system proposed is aimed at the vocal students and persons who want to improve emission of their voices. The goal is not to substituite a singing teacher but to provide a tool for automatic teaching of voice emission basics. In this way singers can develop their vocal skills and improve them. By a visual feedback a student can control and modify vocal tract maximas (resonances) of a chosen vowel to match the resonances of the...
-
Applying computational intelligence to acoustics.
PublicationW artykule przedstawiono przegląd wybranych zagadnień związanych z zastosowaniem metod inteligencji obliczeniowej w akustyce. Zaprezentowane metody obejmują m.in. sztuczne sieci neuronowe, zbiory przyblizone, logikę rozmytą, algorytmy genetyczne. Problematyka akustyczna dotyczy z kolei klasyfikacji dźwięków muzycznych, inteligentnego przetwarzania muzyki, inteligentnego sterowania trakturą organową oraz obiektywizacji metody oceny...
-
Automatic singing voice recognition employing neural networks and rough sets
PublicationCelem prac opisanych w referacie jest automatyczne rozpoznawanie głosów śpiewaczych. Do tego celu utworzona została baza nagrań próbek śpiewu profesjonalnego i amatorskiego. Próbki poddane zostały parametryzacji parametrami zaproponowanymi przez autorów ściśle do tego celu. Sposób wyznaczenia parametrów i ich interpretacja fizyczna przedstawione są w referacie. Parametry wprowadzane są do systemów decyzyjnych, klasyfikatorów opartych...