Publikacje
Filtry
wszystkich: 924
Katalog Publikacji
Rok 2012
-
Hand gesture recognition supported by fuzzy rules and Kalman filters
PublikacjaThe paper presents a system based on camera and multimediaprojector enabling a user to control computer applications by dynamic hand gestures. Gesture recognition methodology based on representing hand movement trajectory by motion vectors analysed using fuzzy rule-based inference is first given. For effective hand position tracking Kalman filters are employed. The system engineered is developed using J2SE and C++/OpenCV technology....
-
Implementacja na procesorze sygnałowym przesuwnika wysokości dźwiękuze skalowaniem zespolonej pulsacji chwilowej
PublikacjaOpracowano przesuwnik wysokości dźwięku wykorzystujący metodę skalowania zespolonej pulsacji chwilowej otrzymywanej za pomocą zespolonego filtru Hilberta. Filtr Hilberta służy do pozyskania dwóchpodstawowych reprezentacji: amplitudy chwilowej oraz pulsacji chwilowej przetwarzanego sygnału, który ma wartości rzeczywiste. Sygnał wynikowy o przesuniętej wysokości dźwięku jest syntetyzowany za pomocą jednoczesnego skalowania powyższych...
-
Improved method for real-time speech stretching
Publikacjan algorithm for real-time speech stretching is presented. It was designed to modify input signal dependently on its content and on its relation with the historical input data. The proposed algorithm is a combination of speech signal analysis algorithms, i.e. voice, vowels/consonants, stuttering detection and SOLA (Synchronous-Overlap-and-Add) based speech stretching algorithm. This approach enables stretching input speech signal...
-
Katedra Systemów Multimedialnych
PublikacjaThe article provides a historical overview, discuss the issues of teaching and research, and presents the current offer of the Department to industry. This article was written on the occasion of the 60th anniversary of the Faculty of Electronics, Telecommunication and Informatics of Gdansk University of Technology. W artykule zamieszczono rys historyczny, omówienie programu dydaktycznego i tematyki badań naukowych oraz aktualną...
-
Methods of Improving Speech Intelligibility for Listeners with Hearing Resolution Deficit
PublikacjaMethods developed for real-time time scale modification (TSM) of speech signal are presented. They are based onthe non-uniform, speech rate depended SOLA algorithm (Synchronous Overlap and Add). Influence of theproposed method on the intelligibility of speech was investigated for two separate groups of listeners, i.e. hearingimpaired children and elderly listeners. It was shown that for the speech with average rate equal to or...
-
Multi-Camera Vehicle Tracking Using Local Image Features and Neural Networks
PublikacjaA method for tracking moving objects crossing fields of view of multiple cameras is presented. The algorithm utilizes Artificial Neural Networks (ANNs). Each ANN is trained to recognize images of one moving object acquired by a single camera. Local image features calculated in the vicinity of automatically detected interest points are used as object image parameters. Next, ANNs are employed to identify the same objects captured...
-
Multiple sound sources localization in real time using acoustic vector sensor
PublikacjaMethod and preliminary results of multiple sound sources localization in real time using the acoustic vector sensor were presented in this study. Direction of arrival (DOA) for considered source was determined based on sound intensity method supported by Fourier analysis. Obtained spectrum components for considered signal allowed to determine the DOA value for the particular frequency independently. The accuracy of the developed...
-
New Applications of Multimodal Human-Computer Interfaces
PublikacjaMultimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...
-
Obiektywizacja bimodalnego procesu percepcji wzrokowo-słuchowej
PublikacjaJednoczesny odbiór bodźców słuchowych i wzrokowych często prowadzi do ukrycia lub przekłamania informacji zawartych w tych bodźcach. W literaturze efekt ten nazywany jest wpływem ściągającym obrazu na percepcję dźwięku. Do niedawna większość badań związanych ze zrozumieniem natury tego zjawiska opierała się na subiektywnych ocenach osób badanych. W referacie zaproponowano metodologię obiektywizacji wyników badań opartą na technologii...
-
Objectivization of Audio-Visual Correlation analysis
PublikacjaSimultaneous perception of audio and visual stimuli often causes the concealment or misrepresentation of information actually contained in these stimuli. Such effects are called the ''image proximity effect'' or the ''ventriloquism effect'' in literature. Until recently, most research carried out to understand their nature was based on subjective assessments. The Authors of this paper propose a methodology based on both subjective...
-
Online Sound Restoration for Digital Library Applications
PublikacjaA system for sound restoration was conceived and engineered having the following features: no special sound restoration software is needed to perform audio restoration by the user, the process of restoration employs automatic reduction of noise, wow and impulse distortions performed in the online mode, no skills in digital signal processing from the user are needed. The principles of the created system and its features as well...
-
Online urban acoustic noise monitoring system
PublikacjaConcepts and implementation of the Online Urban Noise Monitoring System are presented. Principles of proposed solution used for dynamic acoustical maps creating are discussed. The architecture of the system and the data acquisition scheme are described. The concept of noise mapping, based on noise source model and propagation simulations, was developed and employed in the system. Dynamic estimation of noise source parameters utilized...
-
Optymalizacja parametrów algorytmów rekonstrukcji sygnałów muzycznych
PublikacjaNiniejszy referat przedstawia wyniki eksperymentów wykonanych w ramach projektu SYNAT. Przeprowadzono testy algorytmów służących do rekonstrukcji sygnałów muzycznych, tj. redukcji szumu impulsowego, szerokopasmowego oraz przesterowań w celu określenia zoptymalizowanych wartości parametrów algorytmów rekonstrukcji dla różnych gatunków muzycznych.
-
Praktyczne wykorzystanie modelu iso-9126 oraz narzędzi wspomagających proces testowania przy ocenie jakości oprogramowania
Publikacjadokument opisuje wykorzystanie modelu jakości oprogramowania iso-9126 do oceny jakości aplikacji do rozpoznawania osób i zdarzeń, przygotowanej w ramach unijnego projektu mayday euro 2012. zawiera przegląd wykorzystanych technik oraz narzędzi i sposób ich użycia przy ocenie jakości w zakresie funkcjonalności, niezawodności oraz łatwości utrzymania oprogramowania.
-
Projektowanie i analiza rekursywnych cyfrowych oscylatorów sygnałów sinusoidalnych i świergotowych
PublikacjaPrzedmiotem badań w rozprawie są rzeczywiste liniowe filtry cyfrowe rekursywne stacjonarne rzędu drugiego i wyższych, o dwu, trzech i więcej wyjściach - generujące, po pobudzeniu ich warunkami początkowymi, drgania niegasnące sinusoidalne lub przebiegi świergotowe na każdym wyjściu. Informacja o parametrach generowanych sygnałów jest zadawana w postaci warunków początkowych i współczynników struktury filtru. W rozprawie dokonano...
-
Resolving Conflicts in Object Tracking in Video Stream Employing Key Point Matching
PublikacjaA novel approach to resolving ambiguous situations in object tracking in video streams is presented. The proposed method combines standard tracking technique employing Kalman filters with global feature matching method. Object detection is performed using a background subtraction algorithm, then Kalman filters are used for object tracking. At the same time, SURF key points are detected only in image sections identified as moving...
-
System automatycznej analizy poziomu emisji reklam nadawanych w TV
PublikacjaNiniejszy referat przywołuje problem poziomu emisji reklam telewizyjnych. W pierwszej kolejności przedstawiono przegląd wybranych metod analizy poziomu nadawanych sygnałów wizyjno-fonicznych oraz zalecenia normowe dotyczące emisji programów. Opisany został również opracowany system, pozwalający na automatyczną analizę poziomu emitowanych reklam. W eksperymentach wykorzystano przygotowaną bazę nagrań programów telewizyjnych. W referacie...
-
System Supporting Speech Perception in Special Educational Needs Schoolchildren
PublikacjaThe system supporting speech perception during the classes is presented in the paper. The system is a combination of portable device, which enables real-time speech stretching, with the workstation designed in order to perform hearing tests. System was designed to help children suffering from Central Auditory Processing Disorders.
-
System śledzenia punktu fiksacji wzroku jako narzędzie wspierające badania korelacji wzrokowo-słuchowych
PublikacjaPrzedmiotem badań przeprowadzonych w ramach rozprawy są korelacje wzrokowo-słuchowe w kontekście lokalizowania pozornego źródła dźwięku w panoramie stereofonicznej. Prezentacja próbki wizyjno-fonicznej o spójnej treści może prowadzić do przesunięcia położenia pozornego źródła dźwięku w panoramie stereofonicznej w porównaniu z sytuacją, gdy osobie badanej prezentowana jest tylko ścieżka dźwiękowa próbki wizyjno-fonicznej. Efekt...
-
Technologia biomems - przegląd zastosowań
PublikacjaThe paper reviews the issues related to technology, MEMS (Micro-Electro Systems-Mechanical) in the context of applications in biotechnology and biomedical systems. Systems of this type, with applications in biology and medicine, have the name of our common BioMEMS systems. This pertains to a wide range of technology BioMEMS. The aim of this study is to determine future medical MEMS microphones with particular emphasis on their...
-
Tinnitus Therapy Based on High-Frequency Linearization Principles - Preliminary Results
PublikacjaThe aim of this work is to present problems related to tinnitus symptoms, its pathogenesis, hypotheses on tinnitus causes, and therapy treatment to reduce or mask the phantom noise. In addition, the hypothesis on the existence of parasitic quantization that accompanies hearing loss has been recalled. Moreover, the paper describes a study carried out by the Authors with the application of high-frequency dither having specially formed...
-
Typoszereg komputerowych interfejsów multimodalnych
PublikacjaW referacie opisano opracowywane w ramach realizowanego projektu, multimodalne interfejsymultimodalne, ułatwiające użytkowanie urządzeń komputerowych, w tym również terminali mobilnych.Przedstawiono zasady działania poszczególnych interfejsów oraz dotychczasowo uzyskane rezultaty.Wyniki uzyskane zostały drogą prób i eksperymentów z udziałem grup użytkowników docelowych,obejmujących zarówno użytkowników standardowych, jak również...
-
Virtual Whiteboard: A gesture-controlled pen-free tool emulating school whiteboard
PublikacjaIn the paper the so-called Virtual Whiteboard is presented which may be an alternative solution for modern electronic whiteboards based on electronic pens and sensors. The presented tool enables the user to write, draw and handle whiteboard contents using his/her hands only. An additional equipment such as infrared diodes, infrared cameras or cyber gloves is not needed. The user's interaction with the Virtual Whiteboard computer...
-
Zespolona pulsacja chwilowa w analizie i konwersji głosu
PublikacjaPrzedstawiona rozprawa doktorska dotyczy badania głosu z wykorzystaniem reprezentacji sygnału mowy za pomocą zespolonej pulsacji chwilowej (ICF od ang. Instantaneous Complex Frequency). Zespolona pulsacja chwilowa opiera się na koncepcji rzeczywistej częstotliwości chwilowej (IF od ang. Instantaneous Frequency), która estymuje częstotliwość sygnału w każdej chwili czasu jako pochodną jego fazy chwilowej. Główną zaletą takiego podejścia...
Rok 2011
-
3D Hand Shape Modeling for Automatic Assessing Motor Performance in Parkinson's Disease
PublikacjaIn this paper a method for hand pattern processing to create a 3D hand model is presented. By applying a complete hand armature to the model obtained, an interpolation of three motor tests for an individual Parkinson's disease patient can be performed. To obtain the 3D hand model the top view of the hand from a web cam is analyzed. The hand contour is examined to find characteristic points that allows for dividing hand image into...
-
A new approach for an automatic assessment of a neurological condition employing hand gesture classification
Publikacja.
-
A non-uniform real-time speech time-scale stretching method
PublikacjaAn algorithm for non-uniform real-time speech stretching is presented. It provides a combination of typical SOLA algorithm (Synchronous Overlap and Add ) with the vowels, consonants and silence detectors. Based on the information about the content and the estimated value of the rate of speech (ROS), the algorithm adapts the scaling factor value. The ability of real-time speech stretching and the resultant quality of voice were...
-
Algorytm automatycznego rozpoznawania treści tablicy rejestracyjnej i wyszukiwania pojazdów w bazie danych
PublikacjaReferat opisuje algorytm rozpoznawania znaków zawartych w tablicy rejestracyjnej oraz współpracę algorytmu z bazą danych tablic rejestracyjnych. Przedstawiono metodę rozpoznawania znaków wykorzystującą obraz ze zlokalizowaną wcześniej tablicą rejestracyjną. Obraz tablicy jest poddawany przetwarzaniu wstępnemu. Wykonywane są operacje automatycznego wykrywania rotacji tablicy, normalizowania histogramu, dostosowania współczynnika...
-
An approach to determining tinnitus acoustical characteristic
PublikacjaFor many treatment methods, accurate estimation of Tinnitus(ringing in ears) concerning sound type, level, and bandwidth or frequency is inevitable. The proposed way of obtaining Tinnitus parameters is described in this paper. The method employs sound synthesis, aimed at obtaining sound which is closest to perceived Tinnitus. The proposed method assumes running a designed application on a multimedia PC provided with a special graphical...
-
Ankieta intuicyjności gestów rąk zastosowanych od obsługi operacji miksowania dźwięku
PublikacjaW niniejszym raporcie przedstawiono wyniki prac realizowanych przez studentów specjalności Inżynieria Dźwięku i Obrazu Katedry Systemów Multimedialnych w ramach projektu grupowego. Celem projektu było stworzenie grafiki dla aplikacji komputerowej symulującej wybrane operacje możliwe do zrealizowania przy pomocy konsolety fonicznej (stołu mikserskiego). Ów system miksowania ścieżek nagrania muzycznego sterowany jest za pomocą gestów....
-
Application of Vector Sensors to Acoustic Surveillance of a Public Interior Space
PublikacjaPrzedstawiono metodę precyzyjnej detekcji i lokalizacji źródeł dźwięku w pomieszczeniach. Wykorzystano wektorowe czujniki akustyczne, dostarczające sygnałów ciśnienia akustycznego i prędkości cząsteczek powietrza. Zaprezentowano metodę lokalizacji źródeł dźwięku na widowni wydarzenia publicznego. Przedstawiono demonstracyjny system zainstalowany w sali wykładowej. System poddano ocenie dokładności na podstawie przeprowadzonych...
-
Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language
PublikacjaPrzedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...
-
Automatic sound source localization in disturbing conditions using acoustic vector sensors
PublikacjaA concept, practical realization and applications of a passive acoustic radar to automatic localization and tracking of sound sources in disturbing conditions were presented in the paper. The device consists of the new kind of multichannel miniature sound intensity sensors and a group of digital signal processing algorithms. The sensitivity of the realized acoustic radar was examined in free sound field. Several kinds of sound...
-
Automatic tagging of musical files
PublikacjaCelem niniejszej pracy jest zbadanie możliwości automatycznego tagowania utworów muzycznych z wykorzystaniem systemu śledzenia punktu fiksacji wzroku użytkownika. Badania przeprowadzono z udziałem dwudziestu osób o różnym doświadczeniu muzycznym. Zadaniem badanej osoby było wskazanie odpowiedzi na pytania zawarte w ankiecie internetowej, która pozwala na określenie cech utworów muzycznych, takich jak: tempo, dynamika, gatunek....
-
Badanie rozpoznawania twarzy przez człowieka z wykorzystaniem systemu śledzenia fiksacji wzroku Cyber-Oko
PublikacjaW celu dokładniejszego zrozumienia sposobu rozpoznawania i zapamiętywania twarzy przez człowieka przeprowadzono doświadczenie na grupie 20 osób z wykorzystaniem wcześniej opracowanego systemu śledzenia fiksacji wzroku Cyber-Oko. Wykorzystując diody i kamerę podczerwieni wraz z dedykowanym oprogramowaniem Cyber-Oko, które pozwala na śledzenie punktu skupienia wzroku na ekranie. Każdej osobie biorącej udział w doświadczeniu pokazano...
-
Behavior Analysis and Dynamic Crowd Management in Video Surveillance System
PublikacjaA concept and practical implementation of a crowd management system which acquires input data by the set of monitoring cameras is presented. Two leading threads are considered. First concerns the crowd behavior analysis. Second thread focuses on detection of a hold-ups in the doorway. The optical flow combined with soft computing methods (neural network) is employed to evaluate the type of crowd behavior, and fuzzy logic aids detection...
-
Budowa repozytorium trójwymiarowych póz postaci i metoda estymacji pozy na podstawie obserwacji 2D
PublikacjaW referacie przedstawiono metodykę badania algorytmów estymacji układu ciała człowieka w przestrzeni trójwymiarowej na podstawie pojedynczej obserwacji dwuwymiarowej - zdjęcia lub obrazu z kamery. Opisano sposób tworzenia danych odniesienia, zorganizowanych w formie bazy danych zsynchronizowanych nagrań wizyjnych oraz trójwymiarowych danych ruchu. W celu badania algorytmów estymacji pozy wykorzystano trójwymiarowy model ciała ludzkiego...
-
Camera Orientation-Independent Parking Events Detection
PublikacjaThe paper describes the method for detecting precise position and time of vehicles parking in a parking lot. This task is trivial in case of favorable camera orientation but gets much more complex when an angle between the camera viewing axis and the ground is small. The method utilizes background subtraction and object tracking algorithms for detecting moving objects in a video stream. Objects are classified into vehicles and...
-
Camera sabotage detection for surveillance systems
PublikacjaCamera dysfunction detection algorithms and their utilization in realtime video surveillance systems are described. The purpose of using the proposed analysis is explained. Regarding image tampering three algorithms for focus loss, scene obstruction and camera displacement detection are implemented and presented. Features of each module are described and certain scenarios for best performance are depicted. Implemented solutions...
-
Communication Platform for Evaluation of Transmitted Speech Quality
PublikacjaA voice communication system designed and implemented is described. The purpose of the presented platform was to enable a series of experiments related to the quality assessment of algorithms used in the coding and transmitting of speech. The system is equipped with tools for recording signals at each stage of processing, making it possible to subject them to subjective assessments by listening tests or, objective evaluation employing...
-
Comparison of various speech time-scale modificartion methods
PublikacjaThe objective of this work is to investigate the influence of the different time-scale modification (TSM) methods on the quality of the speech stretched up using the designed non-uniform real-time speech time-scale modification algorithm (NU-RTSM). The algorithm provides a combination of the typical TSM algorithm with the vowels, consonants, stutter, transients and silence detectors. Based on the information about the content and...
-
Content-Based Approach to Automatic Recommendation of Music
PublikacjaThis paper presents a content-based approach to music recommendation. For this purpose, a database which contains more than 50000 music excerpts acquired from public repositories was built. Datasets contain tracks of distinct performers within several music genres. All music pieces were converted to mp3 format and then parameterized based on MPEG-7, mel-cepstral and time-related dedicated parameters. All feature vectors are stored...
-
Creating Acoustic Maps Employing Supercomputing Cluster
PublikacjaThe implemented online urban noise pollution monitoring system is presented with regard to its conceptual assumptions and technical realization. A concept of the noise source parameters dynamic assessment is introduced. The idea of noise modeling, based on noise emission characteristics and emission simulations, was developer and practically utilized in the system. Furthermore, the working system architecture and the data acquisition...
-
Detection and localization of selected acoustic events in 3D acoustic field for smart surveillance applications
PublikacjaA method for automatic determination of position of chosen sound events such as speech signals and impulse sounds in 3-dimensional space is presented. The events are localized in the presence of sound reflections employing acoustic vector sensors. Human voice and impulsive sounds are detected using adaptive detectors based on modified peak-valley difference (PVD) parameter and sound pressure level. Localization based on signals...
-
Distributed Framework for Visual Event Detection in Parking Lot Area
PublikacjaThe paper presents the framework for automatic detection of various events occurring in a parking lot basing on multiple camera video analysis. The framework is massively distributed, both in the logical and physical sense. It consists of several entities called node stations that use XMPP protocol for internal communication and SRTP protocol with Jingle extension for video streaming. Recognized events include detecting parking...
-
Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową
PublikacjaW pracy zaprezentowano oryginalny algorytm estymacji wysokości chwilowej dźwięku. Wykorzystuje on zespolone filtry cyfrowe Hilberta o różnej szerokości pasm przepustowych. W eksperymentach posłużono się filtami nacelowanymi na wyznaczanie częstotliwości krtaniowej (odwrotności okresu drgań strun głosowych) na podstawie zarejestrowanych samogłosek wypowiadanych głosem męskim, żeńskim i dziecięcym. W algorytmie zastosowano estymator...
-
Facial features extraction for color, frontal images
PublikacjaThe problem of facial characteristic features extraction is discussed. Several methods of features extraction for color en--face photographs are discussed. The methods are based mainly on the colors features related to the specific regions of the human face. The usefulness of presented methods was tested on a database of en--face photographs consisting of 100 photographs.
-
Fluctuation-enhanced scent sensing using a single gas sensor
PublikacjaWykrywanie zapachów podczas aromaterapii może być przeprowadzone za pomocą pojedynczego sensora gazów. W pracy rozważono efektywność detekcji zapachów olejków eterycznych za pomocą rezystancji DC oraz zjawisk fluktuacyjnych w tych sensorach, typu TGS2600,TGS2602,TGS823. Badania koncentrowały się na praktycznym zastosowaniu w aromaterapii do określania intensywności emitowanego zapachu. Opisano szczegółowo system do emisji zapachów.
-
Fluctuation-enhanced scent sensing using a single gas sensor
PublikacjaScent or aroma sensing during aromatherapy can be carried out by applying only a single resistance gas sensor (TGS - Taguchi Gas Sensors). This paper considers the efficiency of detection of essential oils by DC resistance and its fluctuations observed in TGS sensors. A detailed study has been conducted for scents emitted by five popular essential oils using three sensor types (TGS 2600, TGS 2602, TGS 823). The research was focused...
-
Hałas w szkole - czy warto się nim przejmować?
PublikacjaSzkoła to nie tylko miejsce. w którym dzieci zdobywają wiedzę o otaczającym świecie, lecz także miejsce. w którym kształtuje się osobowość i charakter młodego człowieka. Nabyte umiejętności i utrwalone nawyki procentują później w dorosłym życiu, przesądzając niekiedy o życiowych wyborach. sukcesach lub porażkach.