Publikacje
Filtry
wszystkich: 890
Katalog Publikacji
Rok 2010
-
Real-time speech-rate modification experiments
PublikacjaAn algorithm designed for real-time speech time scale modification (stretching) is proposed, providing a combination of typical synchronous overlap and add based time scale modification algorithm and signal redundancy detection algorithms that allow to remove parts of the speech signal and replace them with the stretched speech signal fragments. Effectiveness of signal processing algorithms are examined experimentally together...
-
Reduction of parasitic pitch variations in archival musical recordings
PublikacjaA new method for reducing parasitic pitch variations in archival audio recordings is presented. The method is intended for analyzing movie soundtracks recorded in optical films. It utilizes image processing for calculating and reducing effects of tape shrinkage being one of the main reasons for parasitic pitch variations in audio accompanying moving images. As long as the film tape characteristics are known the new method can be...
-
Resolving conflicts in object tracking for automatic detection of events in video
PublikacjaW referacie przedstawiono algorytm rozwiązywania konfliktów w śledzeniu obiektów ruchomych. Proponowana metoda wykorzystuje predykcję stanu obiektu obliczaną przez filtry Kalmana oraz dopasowuje wykryte obiekty do struktur śledzących ich ruch na podstawie deskryptorów koloru i tekstury. Omówiono specyficzne sytuacje powodujące konflikty, takie jak rozdzielanie obiektów. Przedstawiono wyniki testów. Algorytm może być zastosowany...
-
Robustness analysis of watermarking-based dtd algorithm under time-variable echo conditions
PublikacjaA novel double-talk detection (DTD) algorithm based on techniques similar to those used for audio signal watermarking was introduced by the authors. The application of the described DTD algorithm within acoustic echo cancellation system is presented. The problem of DTD robustness to time-varying conditions of acoustic echo path is discussed and explanation as to why such conditions occur in practical situations is provided. The...
-
Rozpoznawanie ruchu rąk oraz chodu pacjentów na podstawie analizy sygnałów pochodzących z trójosiowych czujników przyspieszenia
PublikacjaW pracy przedstawiono eksperymenty związane z automatyczną klasyfikacją i rozpoznawaniem aktywności pacjentów z chorobą Parkinsona. W szczególności opisano algorytmy, mające na celu rozpoznawanie dwóch kategorii ruchu: ruchu rąk oraz chodu. Aktywności te wykrywane są na podstawie analizy sygnałów pochodzących z trójosiowych akcelerometrów umieszczonych na ciele osoby badanej.
-
Scent emitting multimodal computer interface for learning enhancement
PublikacjaKomputerowy interfejs aromatyczny stanowi ważne uzupełnienie procesu stymulacji polisensorycznej. Stymulacja ta odgrywa kluczową rolę w terapii i kształceniu dzieci z zaburzeniami rozwoju (np. w przypadku autyzmu czy ADHD). Opracowany interfejs może stać się elementem wyposażenia tzw. sal doświadczania świata, ale może być także stosowany niezależnie stanowiąc znaczące wzbogacenie komputerowych programów edukacyjnych. Dzięki możliwości...
-
Smart Pen - new multimodal computer control tool for graphomotorical therapy
PublikacjaW sytuacji, gdy około 15% populacji uczniów wykazuje cechy dyslektyczne, koniecznością staje się wyposażenie szkół w efektywne narzędzia do diagnozy i terapii tego rodzaju zaburzeń. Dzięki wykorzystaniu tabletu i specjalnie skonstruowanego długopisu wyposażonego w czujniki nacisku uzyskano możliwość monitorowania wielu parametrów, które do tej pory były dla terapeutów całkowicie niedostępne (np. pomiar nacisku na podłoże czy ścisku...
-
Speech synthesis controlled by eye gazing
PublikacjaA method of communication based on eye gaze controlling is presented. Investigations of using gaze tracking have been carried out in various context applications. The solution proposed in the paper could be referred to as ''talking by eyes'' providing an innovative approach in the domain of speech synthesis. The application proposed is dedicated to disabled people, especially to persons in a so-called locked-in syndrome who cannot...
-
Superresolution algorithm to video surveillance system
PublikacjaAn application of a multiframe SR (superresolution) algorithm applied to video monitoring is described. The video signal generated by various types of video cameras with different parameters and signal distortions which may be very problematic for superresolution algorithms. The paper focuses on disadvantages in video signal which occur in video surveillance systems. Especially motion estimation and its influence on superresolution...
-
Synchronizacja półkul mózgowych z wykorzystaniem mechanizmu biofeedback
PublikacjaW niniejszej pracy zaproponowane zostały dwa indywidualne podejścia do budowy systemu wspomagającego synchronizację półkul mózgowych przy pomocy mechanizmu biofeedback. Dla obu rozwiązań wykorzystane zostało urządzenie wykorzystujące bezprzewodowy system rejestracji sygnałów EEG. W pierwszym podejściu sprawdzono wpływ dudnień różnicowych na stan synchronizacji z zastosowaniem statystycznych metod analizy. W drugiej metodzie zbadane...
-
Time-domain prosodic modifications for text-to-speech synthesizer
PublikacjaAn application of prosodic speech processing algorithms to Text-To-Speech synthesis is presented. Prosodic modifications that improve the naturalness of the synthesized signal are discussed. The applied method is based on the TD-PSOLA algorithm. The developed Text-To-Speech Synthesizer is used in applications employing multimodal computer interfaces.
-
UPDRS tests for diagnosis of Parkinson's disease employing virtual-touchpad
PublikacjaThis paper presents a new approach to diagnosing Parkinson's disease. The progression of the disease can be measured by the UPDRS (Unified Parkinson Disease Rating Scale) scale which is used to evaluate motor and behavioral symptoms of Parkinson's disease. Hitherto the evaluation of the advancement of the disease in the UPDRS scale was made by a specialist through medical observation. The authors suggest a partial automation of...
-
Utilization of fuzzy rules in computer character animation
PublikacjaThe chapter presents a method for automatic enhancement of computer character animation utilizing fuzzy inference. First the user designs a prototype version of animation, with keyframes only for important poses, roughly describing the action. Then animation is enriched with new motion phases calculated by the fuzzy inference system using descriptors given by the user. Various degrees of motion fluency and naturalness are possible...
-
Vehicle classification based on soft computing algorithms
PublikacjaExperiments and results regarding vehicle type classification are presented. Three classes of vehicles are recognized: sedans, vans and trucks. The system uses a non-calibrated traffic camera, therefore no direct vehicle dimensions are used. Various vehicle descriptors are tested, including those based on vehicle mask only and those based on vehicle images. The latter ones employ Speeded Up Robust Features (SURF) and gradient images...
-
Verification of the Parameterization Methods in the Context of Automatic Recognition of Sounds Related to Danger
PublikacjaW artykule opisano aplikację, która automatycznie wykrywa zdarzenia dźwiękowe takie jak: rozbita szyba, wystrzał, wybuch i krzyk. Opisany system składa się z bloku parametryzacji i klasyfikatora. W artykule dokonano porównania parametrów dedykowanych dla tego zastosowania oraz standardowych deskryptorów MPEG-7. Porównano też dwa klasyfikatory: Jeden oparty o Percetron (sieci neuronowe) i drugi oparty o Maszynę wektorów wspierających....
-
Video content analysis in the urban area telemonitoring system
PublikacjaThe task of constant monitoring of video streams from a large number of cameras and reviewing the recordings in order to find a specified event requires a considerable amount of time and effort from the system operators and it is prone to errors. A solution to this problem is an automatic system for constant analysis of camera images being able to raise an alarm if a predefined event is detected. The chapter presents various aspects...
-
Virtual keyboard controlled by eye gaze employing speech synthesis
PublikacjaThe article presents the speech synthesis integrated into the eye gaze tracking system. This approach can significantly improve the quality of life of physically disabled people who are unable to communicate. The virtual keyboard (QWERTY) is an interface which allows for entering the text for the speech synthesizer. First, this article describes a methodology of determining the fixation point on a computer screen. Then it presents...
-
Virtual touchpad - video-based multimodal interface
PublikacjaA new computer interface named Virtual-Touchpad (VTP) is presented. The Virtual-Touchpad provides a multimodal interface which enables controlling computer applications by hand gestures captured with a typical webcam. The video stream is processed in the software layer of the interface. Hitherto existing video-based interfaces analyzing frames of hand gestures are presented. Then, the hardware configuration and software features...
-
Wydajność środowisk J2SE i C++ / OpenCV w zagadnieniu sterowania komputerem za pomocą gestów
PublikacjaW rozdziale przedstawiono interfejs sterowania komputerem za pomocą gestów rąk, należący do grupy systemów czasu rzeczywistego o łagodnych granicach (ang. soft real-time). Komponentami systemu są: komputer klasy PC, kamera internetowa, rzutnik multimedialny i ekran dla rzutnika. Oprogramowanie interfejsu opracowano w oparciu o środowiska J2SE i Visual Studio C++ z użyciem biblioteki OpenCV. Moduł systemu realizujący interpretację...
-
Wykorzystanie analizy obrazu ruchów głowy w multimedialnym interfejsie komputerowym
PublikacjaOpracowany interfejs komputerowy umożliwia przeglądanie obrazów statycznych, materiału wizyjnego i fonicznego. Obrazy mogą być przeglądane i wyświetlane w trybie pełnoekranowym. Pliki multimedialne są ułożone w hierarchicznej, wielopoziomowej strukturze. Użytkownik nawiguje po tej strukturze i wyświetla poszczególne elementy poprzez ruch głową w górę, dół, lewo i prawo. Akcja wykonywana przez system zależy od typu zawartości, którą...
-
Zastosowanie XMPP w roli protokołu komunikacji multimedialnej w rozproszonym systemie monitoringu
PublikacjaPrzedstawiono rozproszony system monitoringu bazujący na protokole XMPP, omówiono architekturę i założenia, na których opiera się projekt tego systemu. Przedstawiono cechy protokołu XMPP ze zwróceniem uwagi na te najbardziej istotne w kontekście omawianego zastosowania. Przedyskutowano zagadnienie transmisji multimediów w czasie rzeczywistym z wykorzystaniem rozszerzenia Jingle/XMPP. Zwrócono także uwagę na techniczne aspekty związane...
Rok 2009
-
A double-talk detector using audio watermarking
Publikacjaa novel approach to double-talk detection in the acoustic echo canceler is proposed. a hidden signature is embedded into the arriving signal, using the echo-hiding method. next detection of the presence of this signature in the microphone signal is performed. the results of the signature detection may be used by the acoustic echo canceler to stop or restart the adaptation process.
-
A new methodological approach to the noise threat evaluation based on the selected physiological properties of the human hearing system
PublikacjaA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the selected physiological human hearing system. On the basis of the hearing examinations and noise measurements results and psychoacoustical noise dosimeter performance the new indicators of the noise harmfulness were proposed. The evaluation of the proposed indicators were...
-
A sine wave delay estimator
PublikacjaZaprezentowano nowe rozwiązanie dyskretno-czasowego estymatora ułamkowego opóźnienia sygnału sinusoidalnego, działające w systemie z otwartą pętlą sprzężenia zwrotnego. Proponowane rozwiązanie wykorzystuje koncepcję transformowania za pomocą filtru Hilberta sygnału referencyjnego celem estymacji różnicy fazy tego sygnału względem zaszumionego sygnału odebranego o znormalizowanej (względem okresu próbkowania) częstotliwości - bardzo...
-
Abandoned luggage detection - scenarios at Poznan-Lawica airport
Publikacja -
Accelerometer signal pre-processing influence on human activity recognition
PublikacjaA study of data pre-processing influence on accelerometer-based human activity recognition algorithms is presented. The frequency band used to filter-out the accelerometer signals and the number of accelerometers involved were considered in terms of their influence on the recognition accuracy.
-
An new method of audio-visual correlation analysis
PublikacjaThis paper presents a new methodology of conducting the audio-visual correlation analysis employing the gaze tracking system. Interaction between two perceptual modalities, seeing and hearing, their interaction and mutual reinforcement in a complex relationship was a subject of many research studies. Earlier stage of the carried out experiments at the Multimedia Systems Department (MSD) showed that there exists a relationship between...
-
Application of dynamic time warping and cepstrograms to text-dependent speaker verification
PublikacjaThis work provides a description of an automatic speaker verification (ASV) system. In particular, it documents the evolution of all individual stages of the proposed ASV system design from the phase of preprocessing to an operational decision making system. The aim of this research was to achieve the system of the best safety and ease of use in view of users. The objective estimation of this target has been accomplished by assessing...
-
Audio codec employing frequency-derived tonality measure
PublikacjaA transform codec employing efficient algorithm for detection of spectral tonal components is presented. The tonality measure used in MPEG psychoacoustic model is replaced with the method providing adequate tonality estimates even if the tonal components are deeply frequency modulated. The reliability of hearing threshold estimated using psychoacoustic model with standardized tonality measure and the proposed one is investigated...
-
Automatic Tracking with PTZ Cameras
Publikacja -
Badanie możliwości korekcji ubytku słuchu w polu akustycznym z wykorzystaniem głośników superkierunkowych
PublikacjaCelem pracy jest pokazanie możliwości wykorzystania głośników superkierunkowych w badaniu osób niedosłyszących w polu akustycznym. Przedstawiono budowę oraz wyniki pomiarów charakte-rystyk głośników superkierunkowych w komorze bezechowej. Zaproponowano sposób prowadzenia badań osób niedosłyszących w wolnym polu z wykorzystaniem opisanych głośników oraz metodykę wykorzystania opisanej technologii w procesie korekcji ubytków słuchu....
-
Blokowe algorytmy interpolacji trajektorii zespolonych i oceny ich podobieństwa, z zastosowaniem do weryfikacji dynamicznego podpisu odręcznego
PublikacjaRozprawa doktorska poświęcona jest dwóm zagadnieniom. Pierwsze z poruszanych zagadnień to blokowe algorytmy interpolacji. W stosowanych i opisywanych dotychczas rozwiązaniach interpolacji za pomocą algorytmów blokowych, realizowanych po stronie częstotliwości, czyli przy użyciu transformaty Fouriera, zarówno krotność interpolacji jak i długości interpolowanych sygnałów były ograniczone do kolejnych potęg 2. Wynikało to przede wszystkim...
-
Cameras, microphones, and data storage in current monitoring systems.Technology trends, problems and potential solutions
Publikacja -
Commercial systems for automatic detection of events. Features, limitations and potential solutions
PublikacjaVideo Content Analysis (VCA). Motion detection. Example of complex VCA system. Commercial VCA systems and their applications. Limitations and problems. Possible solutions.
-
Computer based system for strabismus and amblyopia therapy
PublikacjaW publikacji opisano system komputerowy do badania i treningu zeza i amblyopii.W przypadku zeza i amblyopii lub tak zwanego syndromu leniwego oka terapia polega na zasłanianiu oka dominującego przez kilka godzin dziennie lub rozmywanie obrazu w tym oku poprzez zastasowanie kropli do oczu lub silnych soczewek w okularach. Taki sposób terapii powoduje zaburzenie widzenia obuocznego. Proponowane rozwiązanie zachowuje widzenie obuoczne....
-
Dynamic computation of acoustic field distribution in the city area employing a supercomputer
Publikacja -
Enhancement of computer character animation utilizing fuzzy rules
PublikacjaRozdział przedstawia nową metodę przetwarzania komputerowych animacji postaci. Wykorzystuje ona wnioskowanie rozmyte, oparte na regułach i funkcjach przynależności uzyskanych w procesie analizy wyników testów subiektywnej oceny jakości animacji. W trakcie przetwarzania do animacji automatycznie dodawane są nowe fazy ruchu, co skutkuje poprawą jakości wizualnej oraz zmianą płynności i stylizacji ruchu w sposób zamierzony. W referacie...
-
Estimation of object size in the calibrated camera image = Estymacja rozmiaru obiektów w obrazach ze skalibrowanej kamery
PublikacjaIn the paper, a method of estimation of the physical sizes of the objects tracked by the camera is presented. First, the camera is calibrated, then the proposed algorithm is used to estimate the real width and height of the tracked moving objects. The results of size estimation are then used for classification of the moving objects. Two methods of camera calibration are compared, test results are presented and discussed. The proposed...
-
Fractional delayor application in self-tuning sub-sample delay estimator
PublikacjaW artykule przedstawiono nowe rozwiązanie samonastrajalnego estymatora opóźnienia sygnału sinusoidalnego. Estymator działa w czasie dyskretnym. Proponowane rozwiązanie wykorzystuje kaskadowe połączenie cyfrowego filtru ułamkowo opóźniającego służącego do synchronizacji próbkowania i liniowo-fazowego cyfrowego filtru Hilberta. Oryginalność polega na zastosowaniu tu filtrów cyfrowych o bardzo małej złożoności numerycznej. Jest ona...
-
Further developments of parameterization methods of audio stream analysis for secuirty purposes
PublikacjaThe paper presents an automatic sound recognition algorithm intended for application in an audiovisual security monitoring system. A distributed character of security systems does not allow for simultaneous observation of multiple multimedia streams, thus an automatic recognition algorithm must be introduced. In the paper, a module for the parameterization and automatic detection of audio events is described. The spectral analyses...
-
Gdansk University of Technology - INDECT Project Partner Introduction
Publikacja -
Gdansk University of Technology achievements in WP7 of INDECT Project
Publikacja -
Gdansk University of Technology suggestions for WP7 of INDECT Project
Publikacja -
Gesture recognition framework for multimedia content viewer controlling
PublikacjaIn the paper a system for controlling a multimedia content viewer by hand gestures is presented. First, selected methods used for gesture recognition are described. Two different application cases of the system, i.e. for multimedia presentation purposes and for multimedia content viewing are outlined. Moreover, a proposal of improvement of the system combining these approaches is also given. The system work cycle is reviewed. The...
-
Human-computer interaction approach applied to the multimedia system of polysensory integration
PublikacjaIn the paper an approach of utilizing an interaction between the human and computer in a therapy of dyslexia and other sensory disorders is presented. Bakker's neuropsychological concept of dyslexia along with therapy methods are reviewed in the context of the Multimedia System of Polysensory Integration, proposed at the Multimedia Systems Department of Gdansk Univ. of Technology. The system is presented along with the training...
-
Indect input to image processing
Publikacja -
Lip movement and gesture recognition for a multimodal human-computer interface
Publikacja -
Modelowanie jakości powietrza w powiązaniu z modelem numerycznym miasta z wykorzystaniem oprogramowania działającego na platformie wieloprocesorowej
PublikacjaArtykuł przedstawia wyniki modelowania zanieczyszczenia powietrza dla wybranych źródeł drogowych. Obliczenia emisji i propagacji zanieczyszczeń powietrza dokonano za pomocą modelu AUSTAL2000, dostępnego w aplikacji CadnaA. Przedstawiono wyniki analiz dla następujących substancji: SO2, NOx, PM10, benzen. Dodatkowo zamieszczono łączne wyniki zanieczyszczeń powietrza i poziomy hałasu dla rozpatrywanych dróg. Zastosowanie platformy...
-
Motion analysis and classification with motion history imaging
Publikacja -
Multimedialny system monitorowania aglomeracji miejskich
Publikacja