Publikacje
Filtry
wszystkich: 891
Katalog Publikacji
-
Music genre classification applied to bass enhancement for mobile technology
PublikacjaThe aim of this paper is to present a novel approach to the Virtual Bass Synthesis (VBS) algorithms applied to portable computers. The proposed algorithm is related to intelligent, rule-based setting of synthesis parameters according to music genre of an audio excerpt. The classification of music genres is automatically executed employing MPEG 7 parameters and the Principal Component Analysis method applied to reduce information...
-
Dopasowanie charakterystyki dynamiki dźwięku do preferencji słuchowych użytkownika urządzeń mobilnych
PublikacjaW celu określenia preferowanej charakterystyki dynamiki generowanych dźwięków należy uzyskać informację, w jaki sposób użytkownik postrzega głośność dźwięków o różnym poziomie dźwięku. Poruszany problem należy rozpatrywać oddzielnie dla dwóch grup użytkowników – osób słyszących prawidłowo oraz osób z ubytkiem słuchu. W pierwszym przypadku należy zadbać o to, aby wyznaczona charakterystyka dynamiki właściwie przetwarzała dźwięki...
-
Automatyczna weryfikacja klienta bankowego w oparciu o multimodalne technologie biometryczne
PublikacjaW referacie przedstawiono przegląd rozwiązań wykorzystywanych w bankach do weryfikacji tożsamości klientów. Ponadto zawarto opis metod biometrycznych aktualnie wykorzystywanych w placówkach bankowych wraz z odniesieniem do skuteczności i wygody korzystania z dostępnych rozwiązań. Zaproponowano rozszerzenie zakresu wykorzystania technologii biometrycznych, wskazując kierunek rozwoju systemów bezpieczeństwa dla poprawy dostępu do...
-
Measurements and Simulations of Engineered Ultrasound Loudspeakers
PublikacjaSimulation and measurement results of the sound emitted from an ultrasound custom-made system with high spatial directivity are presented. The proposed system is using modulated ultrasound waves which demodulate in nonlinear medium resulting in audible sound. The system is aimed at enhancing the users’ personal audio space, therefore the measurements are performed using the Head and Torso Simulator which provides realistic reproduction...
-
Personal adaptive tuning of mobile computer audio
PublikacjaAn integrated methodology for enhancing audio quality in mobile computers is presented. The key features are adaptation of the characteristics of the acoustic track to the changing conditions and to the user's individual preferences. Original signal processing algorithms are introduced, which concern: linearization of frequency response, dialogue intelligibility enhancement and dynamics processing tuned up to the user's preferences....
-
Examining Influence of Distance to Microphone on Accuracy of Speech Recognition
PublikacjaThe problem of controlling a machine by the distant-talking speaker without a necessity of handheld or body-worn equipment usage is considered. A laboratory setup is introduced for examination of performance of the developed automatic speech recognition system fed by direct and by distant speech acquired by microphones placed at three different distances from the speaker (0.5 m to 1.5 m). For feature extraction from the voice signal...
-
"Creating a numerical model of noise conditions based on the analysis of traffic volume changes in cities with low and medium structure.
PublikacjaThe subject of this research study is to analyze noise conditions of the selected area in the city of Gdańsk using data related to traffic volume changes during a day. This is because daily distribution of noise levels is much more helpful for noise control and reduction than traditional maps with Lden levels indicated. Calculations are made with the use of a numerical model developed at the Gdansk Univ. of Technology and implemented...
-
AUTOMATYCZNE ROZPOZNAWANIE GATUNKÓW MUZYCZNYCH W APLIKACJI SYNTEZUJĄCEJ NISKIE CZĘSTOTLIWOŚCI W URZĄDZENIACH MOBILNYCH
PublikacjaW pracy został opisany inteligentny algorytm syntezy niskich częstotliwości w urządzeniach mobilnych (Smart VBS). Algorytm Smart VBS rozpoznaje gatunek muzyczny i w zależności od wskazania dobiera optymalne parametry syntezy niskich częstotliwości. Synteza niskich częstotliwości odbywa się z wykorzystaniem metody funkcji nieliniowych (NLD). Modyfikacji podlega wykorzystywana funkcja nieliniowa, liczba oraz poziom wzmocnienia dodawanych...
-
Wyznaczanie map hałasu z wykorzystaniem chmury obliczeniowej
PublikacjaW referacie przedstawiono gridow usług obliczeniow Mapy Hałasu. Algorytm predykcji hałasu i model ródła powstał w ramach bada Katedry Systemów Multimedialnych, Politechniki Gdaskiej. Aplikacja webowa umoliwia wykonanie map akustycznych, w szczególnoci hałasu drogowego bez uycia dodatkowego oprogramowania komercyjnego. W pracy przedstawiono zagadnienia z tematyki modelowania hałasu i propagacji dwiku w przestrzeniach miejskich....
-
"Creating a numerical model of noise conditions based on the analysis of traffic volume changes in cities with low and medium structure.
PublikacjaThe subject of this research study is to analyze noise conditions of the selected area in the city of Gdańsk using data related to traffic volume changes during a day. This is because daily distribution of noise levels is much more helpful for noise control and reduction than traditional maps with Lden levels indicated. Calculations are made with the use of a numerical model developed at the Gdansk Univ. of Technology and implemented...
-
Rough Set Based Modeling and Visualization of the Acoustic Field Around the Human Head
PublikacjaThe presented research aims at modeling acoustical wave propagation phenomena by applying rough set theory in a novel manner. In a typical listening environment sound intensity is determined by numerous factors: a distance from a sound source, signal levels and frequencies, obstacles’ locations and sizes. Contrarily, a free-field is characterized by direct, unimpeded propagation of the acoustical waves. The proposed approach is...
-
Analiza drgań struny gitarowej z użyciem szybkich kamer
PublikacjaW referacie przedstawiono metodę analizy i wizualizacji ruchu struny gitarowej. Drgania struny zostały zarejestrowane za pomocą szybkich kamer. Układ optyczny zastosowany do rejestracji został dobrany w taki sposób, by móc obserwować drgania wzdłuż struny. Obrazy zarejestrowane za pomocą szybkich kamer zostały przeanalizowane za pomocą algorytmów cyfrowego przetwarzania sygnałów tak, aby z dużą dokładnością śledzić wychylenia i...
-
3D Sound Intensity Measurement Around Organ Pipes Using Acoustic Vector Sensors
PublikacjaThe aim of the presented paper was to obtain and visualize sound intensity distribution of radiated acoustic energy around the organ pipes. The experimental setup consisted of the multichannel acoustic vector sensor and the specialized Cartesian robot. Measurements were performed in free field with spatial resolution of 0.1 [m]. Two organ pipes, i.e. wooden and metal were measured during the ex-periment. The organ pipes were activated...
-
Survey on Applications of Multimedia Technology to Examine Impact of Roadside Advertising on Drivers
PublikacjaThe correct location of ads, both static and moving, in close proximity of the roadway is an issue of high significance in the context of road safety. This publication aims to provide support in solving these issues by presenting a range of options for the implementation of extensive, multi-faceted research, using modern technology to allow an objective assessment of the risks arising from the presence of advertising spots in the...
-
Automatic sound recognition for security purposes
PublikacjaIn the paper an automatic sound recognition system is presented. It forms a part of a bigger security system developed in order to monitor outdoor places for non-typical audio-visual events. The analyzed audio signal is being recorded from a microphone mounted in an outdoor place thus a non stationary noise of a significant energy is present in it. In the paper an especially designed algorithm for outdoor noise reduction is presented,...
-
Automatic Singing Voice Recognition EmployingNeural Networks and Rough Sets
PublikacjaCelem badań jest automatyczne rozpoznawanie głosów śpiewaczych w kategorii rodzaju i jakości technicznej śpiewu. W artykule opisano stworzoną bazę danych głosów, która zawiera próbki głosu śpiewaków profesjonalnych i amatorskich. W dalszej części opisano parametry zdefiniowane w oparciu o zjawiska biomechaniczne w narządzie głosu podczas śpiewania. W oparciu o stworzone macierze parametrów wytrenowano i porównano automatyczne klasyfikatory...
-
Automatic singing quality recognition employing artificial neural networks
PublikacjaCelem artykułu jest udowodnienie możliwości automatycznej oceny jakości technicznej głosów śpiewaczych. Pokrótce zaprezentowano w nim stworzoną bazę danych głosów śpiewaczych oraz zaimplementowane parametry. Przy pomocy sztucznych sieci neuronowych zaprojektowano system decyzyjny, który oceniono w pięciostopniowej skali jakość techniczną głosu. Przy pomocy metod statystycznych udowodniono, że wyniki generowane przez ten system...
-
Music information analysis and retrieval - a review
PublikacjaW referacie przedstawiono wybrane zagadnienia związane z analizą i wyszukiwaniem informacji muzycznej. Przegląd ten został oparty na literaturze związanej z dziedziną informatyki muzycznej i koncentruje się wokół problemu parametryzacji dźwięków muzycznych i sygnałów fonicznych oraz analizie przydatności wybranych metod tzw. sztucznej inteligencji (ang. computational intelligence) do akwizycji i rozpoznawania obiektów muzycznych...
-
A novel dynamic noise maps visualization tool
PublikacjaW referacie przedstawiono aplikację realizujacą wizualizację dynamicznych map akustycznych zintegrowaną z multimedialnym systemem monitoringu hałasu. Moduł ten został oparty na nowym podejściu do wykreślania dynamicznych map, w referacie przedstawiono porównanie wyników uzyskanych metodami tradycyjnymi i zaproponowaną metodą. Słowa kluczowe: dynamiczne mapy, wizualizacja, monitoring, hałas, system GIS
-
Music information analysis and retrieval techniques
PublikacjaCelem artykułu jest przedstawienie kluczowych zagadnień gwałtownie rozwijającej się gałęzi multimediów, reprezentowanej przez systemy automatycznego wyszukiwania informacji muzycznej MIR - Music Information Retrieval, która urasta do samodzielnej dziedziny zastosowań w obrębie informatyki muzycznej. W artykule przedstawiono wybrane systemy wyszukiwania informacji muzycznej oraz przedstawiono przykład takiego systemu, zrealizowanego...
-
Badanie możliwości korekcji ubytku słuchu w polu akustycznym z wykorzystaniem głośników superkierunkowych
PublikacjaCelem pracy jest pokazanie możliwości wykorzystania głośników superkierunkowych w badaniu osób niedosłyszących w polu akustycznym. Przedstawiono budowę oraz wyniki pomiarów charakte-rystyk głośników superkierunkowych w komorze bezechowej. Zaproponowano sposób prowadzenia badań osób niedosłyszących w wolnym polu z wykorzystaniem opisanych głośników oraz metodykę wykorzystania opisanej technologii w procesie korekcji ubytków słuchu....
-
Audio codec employing frequency-derived tonality measure
PublikacjaA transform codec employing efficient algorithm for detection of spectral tonal components is presented. The tonality measure used in MPEG psychoacoustic model is replaced with the method providing adequate tonality estimates even if the tonal components are deeply frequency modulated. The reliability of hearing threshold estimated using psychoacoustic model with standardized tonality measure and the proposed one is investigated...
-
Time-scale modification of speech signals for supporting hearing impaired schoolchildren
PublikacjaA study of time scale modification algorithmsapplied to hearing impaired schoolchildren supporting ispresented. Variety of algorithms are considered, namely:overlap and add, two variations of synchronized overlapand add, and the phase vocoder. Their effectiveness as wellas real-time processing capabilities are examined.
-
Accelerometer signal pre-processing influence on human activity recognition
PublikacjaA study of data pre-processing influence on accelerometer-based human activity recognition algorithms is presented. The frequency band used to filter-out the accelerometer signals and the number of accelerometers involved were considered in terms of their influence on the recognition accuracy.
-
An new method of audio-visual correlation analysis
PublikacjaThis paper presents a new methodology of conducting the audio-visual correlation analysis employing the gaze tracking system. Interaction between two perceptual modalities, seeing and hearing, their interaction and mutual reinforcement in a complex relationship was a subject of many research studies. Earlier stage of the carried out experiments at the Multimedia Systems Department (MSD) showed that there exists a relationship between...
-
Non-intrusive infrared-free eye tracking method
PublikacjaIn the paper a technique of eye tracking based on visible light is presented. The approach described does not require an additional hardware equipment used in the infrared eye tracking system. First, examples of existing eye tracking techniques were presented. Then, the proposed algorithm of image processing and the process of determining the eye position are described. The engineered eye tracking application was tested and the...
-
Gesture recognition framework for multimedia content viewer controlling
PublikacjaIn the paper a system for controlling a multimedia content viewer by hand gestures is presented. First, selected methods used for gesture recognition are described. Two different application cases of the system, i.e. for multimedia presentation purposes and for multimedia content viewing are outlined. Moreover, a proposal of improvement of the system combining these approaches is also given. The system work cycle is reviewed. The...
-
A new methodological approach to the noise threat evaluation based on the selected physiological properties of the human hearing system
PublikacjaA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the selected physiological human hearing system. On the basis of the hearing examinations and noise measurements results and psychoacoustical noise dosimeter performance the new indicators of the noise harmfulness were proposed. The evaluation of the proposed indicators were...
-
Modelowanie jakości powietrza w powiązaniu z modelem numerycznym miasta z wykorzystaniem oprogramowania działającego na platformie wieloprocesorowej
PublikacjaArtykuł przedstawia wyniki modelowania zanieczyszczenia powietrza dla wybranych źródeł drogowych. Obliczenia emisji i propagacji zanieczyszczeń powietrza dokonano za pomocą modelu AUSTAL2000, dostępnego w aplikacji CadnaA. Przedstawiono wyniki analiz dla następujących substancji: SO2, NOx, PM10, benzen. Dodatkowo zamieszczono łączne wyniki zanieczyszczeń powietrza i poziomy hałasu dla rozpatrywanych dróg. Zastosowanie platformy...
-
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
PublikacjaThis paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
-
Postprodukcja nagrania wideo z dzwiekiem dookolnym
PublikacjaOne of the aims of this paper is to present issues related to audio-video correlation. This is presented on the basis of a short film realization employing surround microphone techniques. First, some related works in the domain of sound and vision correlation are presented. Then assumptions concerning scene creation related to both audio and video are shortly described. Another objective is to discuss results of subjective tests...
-
New technology for hearing stimulation employing the SPS-S method
PublikacjaIstotnym założeniem metody SPS-S jest możliwość stosowania treningu słuchowego w warunkach życia codziennego, a więc także poza gabinetami placówek terapeutycznych. Mobilne urządzenie - stymulator słuchu jest oparte na najnowszej technologii mikroelektronicznej, Oferuje on możliwość wykorzystywania wielu programów terapii, które przebiegają z zastosowaniem algorytmów cyfrowego przetwarzania dźwięku. Algorytmy te można podzielić...
-
Tonality Estimation and Frequency Tracking of Modulated Tonal Components
PublikacjaA novel method for tonality estimation and frequency tracking of tonal components modulated in frequency and amplitude is presented. The algorithm detects the local maxima of magnitude spectra corresponding to three contiguous frames of a signal and matches them into the tonal track candidates. The magnitude-based and phase-based methods are used to estimate the frequency jumps between spectrum maxima belonging to the tonal track...
-
SPS-S - nowa metoda stymulacji słuchowej
PublikacjaIstotnym założeniem metody SPS-S jest możliwość stosowania treningu słuchowego w warunkach życia codziennego, a więc także poza gabinetami placówek terapeutycznych. Mobilne urządzenie - stymulator słuchu jest oparte na najnowszej technologii mikroelektronicznej, Oferuje on możliwość wykorzystywania wielu programów terapii, które przebiegają z zastosowaniem algorytmów cyfrowego przetwarzania dźwięku. Algorytmy te można podzielić...
-
Software for calculation of noise maps implemented on the supercomputer
PublikacjaThis paper presents investigation results relevant to the implementation of the algorithms for the calculation of noise maps. The aim of the implementation of the algorithms on the computer cluster is explained. Selected implementation details of the software called the noise propagation model are described. The interaction of the software with the data acquisition system is presented. Noise maps obtained by exploitation of the...
-
Commercial systems for automatic detection of events. Features, limitations and potential solutions
PublikacjaVideo Content Analysis (VCA). Motion detection. Example of complex VCA system. Commercial VCA systems and their applications. Limitations and problems. Possible solutions.
-
Gdansk University of Technology suggestions for WP7 of INDECT Project
Publikacja -
Abandoned luggage detection - scenarios at Poznan-Lawica airport
Publikacja -
The project MAYDAY EURO 2012. Overview and relation to INDECT
Publikacja -
Nowa metoda oceny szkodliwości hałasu,uwzględniająca psychoakustyczne właściwości słuchu
PublikacjaW referacie przedstawiono koncepcję, algorytm oraz wyniki działania Psychoakustycznego Dozymetru Hałasowego (PDH). Opracowana metoda opiera się na wykorzystaniu wiedzy na temat właściwości słuchu dostęp-nej w literaturze oraz na wynikach badań słuchu i hałasu przeprowadzonych w warunkach laboratoryjnych. Stanowi nowe podejście do zagadnienia oceny szkodliwości hałasu. W tym celu zaproponowano nowe wskaźniki oceny skumu-lowanych...
-
Application of dynamic time warping and cepstrograms to text-dependent speaker verification
PublikacjaThis work provides a description of an automatic speaker verification (ASV) system. In particular, it documents the evolution of all individual stages of the proposed ASV system design from the phase of preprocessing to an operational decision making system. The aim of this research was to achieve the system of the best safety and ease of use in view of users. The objective estimation of this target has been accomplished by assessing...
-
Realizacja specjalnych filtrów cyfrowych o strukturze Farrowa
PublikacjaRozprawa doktorska jest wynikiem pracy nad projektowaniem i implementacją cyfrowych filtrów specjalnych z opóźnieniem ułamkowym za pomocą jednostopniowego przestrajalnego, nierekursywnego filtru o strukturze Farrowa. Założone cele pracy, sformułowane na str. 2, zostały osiągnięte. Wszystkie opisane w pracy filtry zaimplementowano w środowisku obliczeniowym MATLAB i przebadano w celu weryfikacji ich właściwości. Pokazano, że wszystkie...
-
Motion analysis and classification with motion history imaging
Publikacja -
Fractional delayor application in self-tuning sub-sample delay estimator
PublikacjaW artykule przedstawiono nowe rozwiązanie samonastrajalnego estymatora opóźnienia sygnału sinusoidalnego. Estymator działa w czasie dyskretnym. Proponowane rozwiązanie wykorzystuje kaskadowe połączenie cyfrowego filtru ułamkowo opóźniającego służącego do synchronizacji próbkowania i liniowo-fazowego cyfrowego filtru Hilberta. Oryginalność polega na zastosowaniu tu filtrów cyfrowych o bardzo małej złożoności numerycznej. Jest ona...
-
WP1 of INDECT Project: Intelligent Monitoring and Automatic Detection of Threats
Publikacja -
Overview of current communication systems for security forces. Features, limitations and potential solutions
Publikacja -
WP1: Intelligent Monitoring and Automatic Detection of Threats - partners cooperation
Publikacja -
Dynamic computation of acoustic field distribution in the city area employing a supercomputer
Publikacja -
Nagranie formy muzycznej w systemie stereofonii dookólnej
PublikacjaCelem pracy była realizacja nagrania kwintetu jazzowego w wybranych systemach stereofonii wielokanałowej. Dodatkowym celem było przeprowadzenie testów subiektywnych zrealizowanych nagrań. W pracy zawarto w pierwszej kolejności zagadnienia związane z przestrzenną lokalizacją źródeł dźwięku przez człowieka. W dalszej części przywołane zostały wybrane techniki mikrofonowe stereofonii wielokanałowej, a także metody prowadzenia testów...
-
Pasywny Radar Akustyczny
Publikacja -
Estimation of object size in the calibrated camera image = Estymacja rozmiaru obiektów w obrazach ze skalibrowanej kamery
PublikacjaIn the paper, a method of estimation of the physical sizes of the objects tracked by the camera is presented. First, the camera is calibrated, then the proposed algorithm is used to estimate the real width and height of the tracked moving objects. The results of size estimation are then used for classification of the moving objects. Two methods of camera calibration are compared, test results are presented and discussed. The proposed...
-
Multimedialny system wspomagający identyfikację i zwalczanie przestępczości oraz terroryzmu
PublikacjaArtykuł zawiera przegląd zakresu prac badawczych, które prowadzone są w Politechnice Gdańskiej w ramach realizowanego projektu badawczo-rozwojowego. Opisany jest rozproszony system monitoringu i komunikacji multimedialnej, realizujący kompleksowe zarządzanie zasobami mobilnymi i komunikację multimedialną w czasie rzeczywistym pomiędzy elementami systemu. System realizuje równoczesną analizę obrazu, dźwięku i sygnałów pochodzących...
-
Gdansk University of Technology achievements in WP7 of INDECT Project
Publikacja -
Gdansk University of Technology - INDECT Project Partner Introduction
Publikacja -
State of Deliverable D1.1 of INDECT Project
Publikacja -
Multimedialny system monitorowania aglomeracji miejskich
Publikacja -
WP1: Intelligent monitoring and automatic detection of threats -introduction to the WP1
Publikacja -
Blokowe algorytmy interpolacji trajektorii zespolonych i oceny ich podobieństwa, z zastosowaniem do weryfikacji dynamicznego podpisu odręcznego
PublikacjaRozprawa doktorska poświęcona jest dwóm zagadnieniom. Pierwsze z poruszanych zagadnień to blokowe algorytmy interpolacji. W stosowanych i opisywanych dotychczas rozwiązaniach interpolacji za pomocą algorytmów blokowych, realizowanych po stronie częstotliwości, czyli przy użyciu transformaty Fouriera, zarówno krotność interpolacji jak i długości interpolowanych sygnałów były ograniczone do kolejnych potęg 2. Wynikało to przede wszystkim...
-
Zastosowanie reguł rozmytych w komputerowej animacji postaci - wybrane zagadnienia
PublikacjaCelem badawczym rozprawy było wykazanie możliwości wykorzystania inteligentnych metod obliczeniowych, głównie logiki rozmytej, w animacji komputerowych postaci. Powstał system pozwalający w sposób półautomatyczny tworzyć animacje płynne i nacechowane stylistycznie. Poprawność wykorzystanego podejścia została zweryfikowana w toku testów oceny z udziałem dużej liczby widzów-ekspertów.
-
Cameras, microphones, and data storage in current monitoring systems.Technology trends, problems and potential solutions
Publikacja -
Zastosowanie sieci Mobile WiMAX w aglomeracji
Publikacja -
Further developments of parameterization methods of audio stream analysis for secuirty purposes
PublikacjaThe paper presents an automatic sound recognition algorithm intended for application in an audiovisual security monitoring system. A distributed character of security systems does not allow for simultaneous observation of multiple multimedia streams, thus an automatic recognition algorithm must be introduced. In the paper, a module for the parameterization and automatic detection of audio events is described. The spectral analyses...
-
A double-talk detector using audio watermarking
Publikacjaa novel approach to double-talk detection in the acoustic echo canceler is proposed. a hidden signature is embedded into the arriving signal, using the echo-hiding method. next detection of the presence of this signature in the microphone signal is performed. the results of the signature detection may be used by the acoustic echo canceler to stop or restart the adaptation process.
-
A sine wave delay estimator
PublikacjaZaprezentowano nowe rozwiązanie dyskretno-czasowego estymatora ułamkowego opóźnienia sygnału sinusoidalnego, działające w systemie z otwartą pętlą sprzężenia zwrotnego. Proponowane rozwiązanie wykorzystuje koncepcję transformowania za pomocą filtru Hilberta sygnału referencyjnego celem estymacji różnicy fazy tego sygnału względem zaszumionego sygnału odebranego o znormalizowanej (względem okresu próbkowania) częstotliwości - bardzo...
-
Indect input to image processing
Publikacja -
Automatic Tracking with PTZ Cameras
Publikacja -
Ustomysz
Publikacja -
WP7 Applications proposed by GUT. Use Cases and Benchmarks
Publikacja -
System monitorujący stopień koncentracji uwagi uczniów
PublikacjaSystem śledzenia punktu fiksacji wzroku pozwala śledzić miejsce na ekranie monitora, na które patrzy użytkownik. W niniejszym artykule opisano system śledzenia punktu fiksacji wzroku w kontekście nowoczesnego zastosowania - w badaniu stopnia koncentracji uwagi u dzieci. W części pierwszej artykułu przedstawiono konfigurację sprzętową systemu oraz scharakteryzowano zagadnienie koncentracji uwagi. W drugiej, właściwej części, opisano...
-
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
PublikacjaW pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.
-
Rozpoznawanie kategorii ruchu ludzkiego na podstawie analizy sygnałów pochodzących z trójosiowych czujników przyspieszenia
PublikacjaW artykule przedstawiono procedurę rejestracjisygnałów przyspieszenia pochodzących z czujnikówbiomedycznych Shimmer, sposób ich rozmieszczenia na ciele orazopisano klasyfikator pozwalający na rozpoznawanie wybranychkategorii ruchu ludzkiego. W części eksperymentalnej artykułuzbadano wpływ filtracji dolnoprzepustowej sygnałów naskuteczność rozpoznawania typu aktywności ruchowej.
-
Testing A Novel Gesture-Based Mixing Interface
PublikacjaWith a digital audio workstation, in contrast to the traditional mouse-keyboard computer interface, hand gestures can be used to mix audio with eyes closed. Mixing with a visual representation of audio parameters during experiments led to broadening the panorama and a more intensive use of shelving equalizers. Listening tests proved that the use of hand gestures produces mixes that are aesthetically as good as those obtained using...
-
Śledzenie głowy użytkownika komputera z użyciem kamery Time of Flight
PublikacjaOpisano opracowaną metodę śledzenia położenia głowy użytkownika komputera lub urządzenia mobilnego przy wykorzystaniu kamery mierzącej czas powrotu wiązki promieniowania elektromagnetycznego podczerwonego odbitej od oświetlanego obiektu (ang. Time Of Flight camera). Dzięki zastosowaniu odpowiednich metod cyfrowego przetwarzania obrazu pozyskanego z kamery tego typu możliwe jest zlokalizowanie użytkownika w przestrzeni 3D. Znajomość...
-
Metody Śledzenia Obiektów W Rozproszonych Systemach Monitoringu Wideo
PublikacjaSystemy monitoringu wideo stały się powszechną częścią zarówno przestrzeni publicznej jak również miejsc o ograniczonym dostępie. Nadzór obszaru o dużej powierzchni wymaga rozmieszczenia wielu kamer. Skuteczna analiza przez człowieka dużej liczby obrazów wideo jest praktycznie niemożliwa. Dlatego rozwijane są metody służące do automatycznego przetwarzania wideo ukierunkowanego na analizę kontekstową. W przypadku niepokrywających...
-
Rozpoznawanie ruchów i gestów wykonywanych ustami w obrazie wizyjnym z użyciem sieci neuronowych
PublikacjaUstomysz jest interfejsem komputerowym, umożliwiającym sterowanie kursorem ekranowym za pomocą ruchów ust i gestów wykonywanych ustami. Główną grupą docelową użytkowników interfejsu są osoby, które z dowolnego powodu nie mogą lub nie chcą posługiwać się tradycyjną klawiaturą i myszką komputerową. W związku z tym, może on umożliwić osobom niepełnosprawnym ruchowo, np. z niedowładem kończyn posługiwanie się komputerem, a przez to...
-
Adaptive acoustic crosstalk cancellation in mobile computer device
PublikacjaThe cancellation of acoustic crosstalk is employed to enhance the stereo image in mobile listening conditions. A practical setup employing a mobile computer is employed. The adaptation of the crosstalk cancellation filter to the position of the listener's head is featured. The measurement evaluating the possibility of practical application of the method are described. The head and torso simulator was used for measurements. The...
-
Modelling Object Behaviour in a Video Surveillnace System Using Pawlak's Flowgraph
PublikacjaIn this paper, methodology of acquisition and processing of video streams for the purpose of modelling object behaviour is presented. Multilevel contextual video processing was also mentioned. The Pawlak’s flowgraph is used as a container for the knowledge related to the behaviour of objects in the area supervised by a video surveillance system. Spatio-temporal dependencies in transitions between cameras can be easily changed in...
-
Fitting the mobile device characteristics to the user's hearing preferences
PublikacjaA method for fitting the mobile computer audio characteristics to the user's hearing preferences is proposed. The process consists of two stages: calibration and dynamics processing. During the calibration phase the user performs a loudness scaling test giving their response regarding the perceived loudness. The dynamics processing made on above basis sets the loudness to the most comfortable level. The processing accounts both...
-
Detection of vehicles stopping in restricted zones in video from surveillance cameras
PublikacjaAn algorithm for detection of vehicles that stop in restricted areas, e.g. excluded by traffic rules, is proposed. Classic approaches based on object tracking are inefficient in high traffic scenes because of tracking errors caused by frequent object merging and splitting. The proposed algorithm uses the background subtraction results for detection of moving objects, then pixels belonging to moving objects are tested for stability....
-
Supercomputing Grid-Based Services for Hearing Protection and Acoustical Urban Planning, Research and Education
PublikacjaSpecific computational environments, so-called domain grids, are developed within the PLGrid Plus project in order to prepare specialized IT solutions, i.e., dedicated software implementations and hardware (infrastructure adaptation), suited for particular research group demands. One of the PLGrid Plus domain grids, presented in this paper, is Acoustics. The article describes in detail two kinds of the acoustic domain services....
-
An Approach to Bass Enhancement in Portable Computers Employing Smart Virtual Bass Synthesis Algorithms
PublikacjaThe aim of this paper is to present a novel approach to the Virtual Bass Synthesis (VBS) algorithms applied to portable computers. The developed algorithms are related to intelligent, rule-based setting of synthesis parameters according to music genre of an audio excerpt and to the type of a portable device in use. To find optimum synthesis parameters of the VBS algorithms, subjective listening tests based on a parametric procedure...
-
Video analytics-based algorithm for monitoring egress from buildings
PublikacjaA concept and a practical implementation of the algorithm for detecting of potentially dangerous situations related to crowding in passages is presented. An example of such a situation is a crush which may be caused by an obstructed pedestrian pathway. The surveillance video camera signal analysis performed in the online mode is employed in order to detect hold-ups near bottlenecks like doorways or staircases. The details of the...
-
Music Recommendation System
PublikacjaThe paper focuses on optimization vector content feature for the music recommendation system. For the purpose of experiments a database is created consisting of excerpts of music les. They are assigned to 22 classes corresponding to dierent music genres. Various feature vectors based on low-level signal descriptors are tested and then optimized using correlation analysis and Principal Component Analysis (PCA). Results of the experiments...
-
Examining Acoustic Emission of Engineered Ultrasound Loudspeakers
PublikacjaMeasurement results of the sound emitted from an ultrasound custom-made system with high spatial directivity are presented. The proposed system is using modulated ultrasound waves which demodulate in nonlinear medium resulting in audible sound. The system is aimed at enhancing the users’ personal audio space, therefore the measurements are performed using the Head and Torso Simulator which provides the realistic reproduction of...
-
EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY
PublikacjaThe problem of video framerate and audio/video synchronization in audio-visual speech recogni-tion is considered. The visual features are added to the acoustic parameters in order to improve the accuracy of speech recognition in noisy conditions. The Mel-Frequency Cepstral Coefficients are used on the acoustic side whereas Active Appearance Model features are extracted from the image. The feature fusion approach is employed. The...
-
SUBJECTIVE PERCEPTION OF MUSIC GENRES IN THE FIELD OF MUSIC INFORMATION RETRIEVAL SYSTEMS
PublikacjaThe aim of this paper is to evaluate the relationship between perception of music genres and subjective features of music that can be assigned to them. For this purpose a group of subjective features such as loudness, melody, rhythm, volume, instrumentation was chosen to describe music genres. A group of 30 listeners with normal hearing, ranging from 20 to 40, was created. Each sub-ject participating in listening tests was asked...
-
Aktywny system RFID do lokalizacji i identyfikacji obiektów w wielomodalnej infrastrukturze bezpieczeństwa
PublikacjaPrzedstawiono prace koncepcyjne, badawcze oraz implementacyjne skoncentrowane na praktycznej realizacji systemu detekcji obiektów z wykorzystaniem kamer wizyjnych i identyfikacji radiowej. Zaproponowano rozbudowę wielomodalnego teleinformatycznego systemu bezpieczeństwa o warstwę identyfikacji radiowej obiektów. Omówiono założenia zaprojektowanego systemu oraz opracowaną warstwę sprzętową. Zaproponowano i przedyskutowano praktyczne...
-
An Approach to the Detection of Bank Robbery Acts Employing Thermal Image Analysis
PublikacjaA novel approach to the detection of selected security-related events in bank monitoring systems is presented. Thermal camera images are used for the detection of people in difficult lighting conditions. Next, the algorithm analyses movement of objects detected in thermal or standard monitoring cameras using a method evolved from the motion history images algorithm. At the same time, thermal images are analyzed in order to detect...
-
Further Developments of the Online Sound Restoration System for Digital Library Applications
PublikacjaNew signal processing algorithms were introduced to the online service for audio restoration available at the web address: www.youarchive.net. Missing or distorted audio samples are estimated using a specific implementation of the Jannsen interpolation method. The algorithm is based on the autoregressive model (AR) combined with the iterative complementation of signal samples. Since the interpolation algorithm is computationally...
-
Inteligentna Synteza Niskich Częstotliwości w urządzeniach mobilnych
PublikacjaW pracy przedstawiono algorytm inteligentnej adaptacji parametrów syntezy niskich częstotliwości w urządzeniach przenośnych w zależności od odtwarzanego gatunku muzycznego (Smart VBS). Proponowany algorytm wykorzystuje metody generacji harmonicznych oparte na generatorze funkcji nieliniowych (NLD) i wokoderze fazowym (PV). Dla znalezienia optymalnych parametrów syntezy przeprowadzono testy subiektywne sprawdzające powiązanie parametrów...
-
Smart Virtual Bass Synthesis Algorithm Based on Music Genre Classification
PublikacjaThe aim of this paper is to present a novel approach to the Virtual Bass Synthesis (VBS) algorithms applied to portable computers. The proposed algorithm employed automatic music genre recognition to determine the optimum parameters for the synthesis of additional frequencies. The synthesis was carried out using the non-linear device (NLD) and phase vocoder (PV) methods depending on the music excerpt genre. Classification of musical...
-
Repozytorium nagrań testowych i algorytmy wspomagania systemów monitoringu przestrzeni publicznej
PublikacjaW referacie przedstawiono założenia i realizację repozytorium nagrań testowych dla potrzeb oceny algorytmów analizy obrazu. Celem wykonanej pracy jest zgromadzenie materiałów audiowizualnych zawierających różne rodzaje zachowań tłumu wraz z opisem służących do weryfikacji algorytmów analizy obrazu. Omówiono szczegółowo treść nagrań wprowadzonych do repozytorium, wśród których wyróżnić można zachowania typowe jak i nietypowe. Przedstawiono...
-
Music Mixing Process Controlled by Hand Gestures
PublikacjaW referacie przedstawiono system umożliwiający sterowanie procesami miksowania śladów nagrania muzycznego za pomocą gestów rąk. Przybliżono podstawy wielomodalnej percepcji argumentujące potrzebę powstania tego typu systemu oraz założenia przyjęte w trakcie jego tworzenia. Część sprzętowa systemu składa się z rzutnika multimedialnego, kamery internetowej, komputera klasy PC z zainstalowanym oprogramowaniem systemu oraz ekranu dla...
-
Resolving conflicts in object tracking for automatic detection of events in video
PublikacjaAn algorithm for resolving conflicts in tracking of moving objects is presented. The proposed approach utilizes predicted states calculated by Kalman filters for estimation of trackers position, then it uses color and texture descriptors in order to match moving objects with trackers. Problematic situations, such as splitting objects, are addressed. Test results are presented and discussed. The algorithm may be used in the system...
-
Badanie rozpoznawania twarzy przez człowieka z wykorzystaniem systemu śledzenia fiksacji wzroku Cyber-Oko
PublikacjaW celu dokładniejszego zrozumienia sposobu rozpoznawania i zapamiętywania twarzy przez człowieka przeprowadzono doświadczenie na grupie 20 osób z wykorzystaniem wcześniej opracowanego systemu śledzenia fiksacji wzroku Cyber-Oko. Wykorzystując diody i kamerę podczerwieni wraz z dedykowanym oprogramowaniem Cyber-Oko, które pozwala na śledzenie punktu skupienia wzroku na ekranie. Każdej osobie biorącej udział w doświadczeniu pokazano...
-
A non-uniform real-time speech time-scale stretching method
PublikacjaAn algorithm for non-uniform real-time speech stretching is presented. It provides a combination of typical SOLA algorithm (Synchronous Overlap and Add ) with the vowels, consonants and silence detectors. Based on the information about the content and the estimated value of the rate of speech (ROS), the algorithm adapts the scaling factor value. The ability of real-time speech stretching and the resultant quality of voice were...
-
Rozpoznawanie dynamicznych i statycznych gestów rąk w zastosowaniu do sterowania aplikacjami komputerowymi
PublikacjaW referacie przedstawiono interfejs, metody oraz algorytmy sterowania komputerem za pomocą dynamicznych i statycznych gestów rąk. Komponentami opracowanego rozwiązania są komputer klasy PC wraz z opracowanym interfejsem i oprogramowaniem, kamera internetowa oraz projektor multimedialny. Gesty rozpoznawane są w procesie analizy obrazu wizyjnego pozyskanego z kamery internetowej przymocowanej do projektora oraz analizy obrazu wyświetlanego...
-
Ankieta intuicyjności gestów rąk zastosowanych od obsługi operacji miksowania dźwięku
PublikacjaW niniejszym raporcie przedstawiono wyniki prac realizowanych przez studentów specjalności Inżynieria Dźwięku i Obrazu Katedry Systemów Multimedialnych w ramach projektu grupowego. Celem projektu było stworzenie grafiki dla aplikacji komputerowej symulującej wybrane operacje możliwe do zrealizowania przy pomocy konsolety fonicznej (stołu mikserskiego). Ów system miksowania ścieżek nagrania muzycznego sterowany jest za pomocą gestów....
-
Intelligent multimedia solutions supporting special education needs.
PublikacjaThe role of computers in school education is briefly discussed. Multimodal interfaces development history is shortly reviewed. Examples of applications of multimodal interfaces for learners with special educational needs are presented, including interactive electronic whiteboard based on video image analysis, application for controlling computers with facial expression and speech stretching audio interface representing audio modality....
-
Report of the ISMIS 2011 Contest : Music Information Retrieval
PublikacjaThis report presents an overview of the data mining contestorganized in conjunction with the 19th International Symposiumon Methodologies for Intelligent Systems (ISMIS 2011), in days betweenJan 10 and Mar 21, 2011, on TunedIT competition platform. The contestconsisted of two independent tasks, both related to music information retrieval:recognition of music genres and recognition of instruments, for agiven music sample represented...