Publications
Filters
total: 890
Catalog Publications
-
Rough Set Based Modeling and Visualization of the Acoustic Field Around the Human Head
PublicationThe presented research aims at modeling acoustical wave propagation phenomena by applying rough set theory in a novel manner. In a typical listening environment sound intensity is determined by numerous factors: a distance from a sound source, signal levels and frequencies, obstacles’ locations and sizes. Contrarily, a free-field is characterized by direct, unimpeded propagation of the acoustical waves. The proposed approach is...
-
Analiza drgań struny gitarowej z użyciem szybkich kamer
PublicationW referacie przedstawiono metodę analizy i wizualizacji ruchu struny gitarowej. Drgania struny zostały zarejestrowane za pomocą szybkich kamer. Układ optyczny zastosowany do rejestracji został dobrany w taki sposób, by móc obserwować drgania wzdłuż struny. Obrazy zarejestrowane za pomocą szybkich kamer zostały przeanalizowane za pomocą algorytmów cyfrowego przetwarzania sygnałów tak, aby z dużą dokładnością śledzić wychylenia i...
-
Loudness Scaling Tests in Hearing Problems Detection
PublicationThe number of people using portable audio players has increased significantly over the recent years. This implies the rise in the number of people having hearing loss problems. Therefore, there is a need to find appropriate procedures that simplify the process of the hearing problem detection. Investigations performed show that audiometric tests may not be sufficient to assess hearing in young people. Contrarily, the obtained results...
-
Development of the sound field 3D intensity probe based on miniature microphones
PublicationThe engineered measuring probe uses three pairs of miniature microphones coupled. The signals from the microphones after an initial amplification are fed to differential circuits. Due to the required symmetry of the circuit it was necessary to select electronic components very carefully. Moreover, additional digital signal processing techniques were applied to avoid amplitude and phase mismatch. The view of the engineered probe...
-
GRAPHICAL REPRESENTATION OF MUSIC SET BASED ON MOOD OF MUSIC. GRAFICZNA PREZENTACJA ZBIORU MUZYCZNEGO OPARTA NA ANOTACJI NASTROJU MUZYKI
PublicationOne of the features for music recommendation, which is useful and intuitive for music listen-ers, is “mood”. The paper presents an approach to graphical representation of mood of music pieces. Subjective evaluation based on listening tests is performed for assigning mood labels of 150 pieces of music and placing them on the 2D mood plane. As a result, a map of songs is created, where music excerpts with similar mood are organized...
-
Survey on Applications of Multimedia Technology to Examine Impact of Roadside Advertising on Drivers
PublicationThe correct location of ads, both static and moving, in close proximity of the roadway is an issue of high significance in the context of road safety. This publication aims to provide support in solving these issues by presenting a range of options for the implementation of extensive, multi-faceted research, using modern technology to allow an objective assessment of the risks arising from the presence of advertising spots in the...
-
Adaptive system for recognition of sounds indicating threats to security of people and property employing parallel processing of audio data streams
PublicationA system for recognition of threatening acoustic events employing parallel processing on a supercomputing cluster is featured. The methods for detection, parameterization and classication of acoustic events are introduced. The recognition engine is based onthreshold-based detection with adaptive threshold and Support Vector Machine classifcation. Spectral, temporal and mel-frequency descriptors are used as signal features. The...
-
Zdalny zintegrowany moduł nadzoru radiowo-wizyjnego
PublicationPrzedstawiono prace koncepcyjne, badawcze oraz implementacyjne skoncentrowane na praktycznej realizacji sys-temu lokalizacji i śledzenia obiektów z wykorzystaniem kamer wizyjnych i identyfikacji radiowej. Zaproponowano metodę konkatenacji danych w celu zwiększenia dokładno-ści i skuteczności detekcji obiektów. Omówiono założenia projektowe oraz technologie opracowane w ramach rozwi-janego multimodalnego modułu nadzoru. Zaproponowano...
-
Measuring and Analyzing Audio Levels in Film, Commercials, and Movie Trailers Using Leq(A) Values and the LUFS Loudness Model . Analiza pomiarów dźwięku w filmie oraz w reklamach filmowych z wykorzystaniem modelu głośności
PublicationThe purpose of this paper is to describe the measurement of loudness levels in movies, movie trailers, and commercials displayed before feature films at movie theaters. In the initial section, the paper discusses the issues related to measurement of loudness levels, provides recommendations regarding permissible loudness levels during movie screenings, and mentions the applied units of measurement. The following section of the...
-
Cross-domain applications of multimodal human-computer interfaces
PublicationDeveloped multimodal interfaces for education applications and for disabled people are presented, including interactive electronic whiteboard based on video image analysis, application for controlling computers with mouth gestures and audio interface for speech stretching for hearing impaired and stuttering people and intelligent pen allowing for diagnosing and ameliorating developmental dyslexia. The eye-gaze tracking system named...
-
Independent dynamics of slow, intermediate, and fast intracranial EEG spectral activities during human memory formation
PublicationA wide spectrum of brain rhythms are engaged throughout the human cortex in cognitive functions. How the rhythms of various low and high frequencies are spatiotemporally coordinated across the human brain during memory processing is inconclusive. They can either be coordinated together across a wide range of the frequency spectrum or induced in specific bands. We used a large dataset of human intracranial electroencephalography...
-
Applications of knowledge technologies to sound and vision engineering
PublicationSpecjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...
-
DSP techniques for determining ''Wow'' distortions
PublicationArtykuł przedstawia opis algorytmów do wyznaczania charakterystyki zniekształceń kołysania dźwięku. Są to algorytmy: śledzenia przydźwięku sieciowego, śledzenia pozostałości magnetycznej prądu podkładu wielkich częstotliwości, adaptacyjnej analizy środka ciężkości widma dla wybranej części zniekształconego sygnału. Przedstawione algorytmy pozwalają na implementację programową i sprzętową.
-
Expert system for automatic classification and quality assessment of singing voices
Publication.
-
Expert system for automatic classification and quality assessment of singing voices
Publication.
-
Wow defect reduction based on interpolation techniques
PublicationW artykule przedstawiono wyniki badania różnych technik interpolacji wykorzystanych w redukcji kołysania dźwięku. W badaniach użyto: interpolację liniową, techniki interpolacji wielomianowej, i interpolację funkcją sink. Jakość rekonstrukcji zbadano wykorzystując sztucznie spreparowany sygnał foniczny, zrekonstruowany wymienionymi metodami interpolacji. Jakość rekonstrukcji oceniono wykorzystując standardowe deskryptory jakości...
-
Determining the noise impact on hearing using psychoacoustical noise dosimeter
PublicationThis research study presents the designed noise dosimeter based on psychoacoustical properties of the human hearing system and, at the same time. evaluation of time and frequency characteristics of noise. The designed noise dosimeter enables assessing temporary threshold shift (TTS) in critical hands in real time. In this way it is possible monitoring the hearing threshold shift continuously for people who stay in the harmful noise...
-
Interpolation of complex dynamic trajectory for hand-written signature verification
PublicationRożważono problem interpolacji trajektorii jedno-grafelowego podpisu odręcznego do rozpoznawania i weryfikacji podpisu złożonego za pomocą tabletu. Przedyskutowano użyteczność interpolacji celem unifikacji podpisu, dla potrzeb porównania aktualnie złożonego podpisu ze wzorcem zapisanym w bazie. Wykorzystano różne reprezentacje trajektorii. Opracowano system decyzyjny wykorzystujący filtr dopasowany. Pracę zilustrowano przykładami...
-
Urban noise propagation modeling in the Multimedia Noise Monitoring System
Publication.
-
Estymacja tonu krtaniowego w oparciu o zespoloną pulsację chwilową
PublicationW niniejszej pracy zaproponowano nową metodę ekstrakcji tonu krtaniowego w oparciu o zespoloną pulsacjęchwilową - ICF (ang. Instantaneous Complex Frequency). Zaproponowano interaktywny algorytm analizy ICF sygnałumowy, którego wyniki udokumentowano zarówno w dziedzinie czasu (na płaszczyźnie Arganda) jak i w dziedzinieczęstotliwości. Na podstawie osiągniętych wyników wykazano bezpośredni, jednoznaczny związek pomiędzy okresemtonu...
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublicationIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Evaluation of Hilbert transform filter performance
PublicationW pracy rozpatrzono zagadnienie adaptacyjnej estymacji ułamkowego opóźnienia pomiędzy dwoma sygnałami sinusoidalnymi. Zastosowano tu nowy, zagregowany, zespolony filtr Hilberta, który łączy w sobie funkcje filtracji Hilberta i kompensacji ułamkowego opóźnienia. W eksperymentach wykorzystano efektywną implementację tego filtru w strukturze Farrowa, której jedynym parametrem o zmiennej wartości jest bieżące opóźnienie ułamkowe.
-
Porównanie metod filtracji w dziedzinie widma DFT
PublicationW niniejszej pracy zaprezentowano porównanie metod filtracji w dziedzinie częstotliwości,czyli w dziedzinie widma DFT. Opisano i omówiono podstawowe metody filtracji: bez zeropaddingu, z zeropaddingiem oraz metodę Cheh Pana. Pokazane i porównane zostały wyniki eksperymentów dla typowych aplikacji, jakimi są filtr dolnoprzepustowy i filtr różniczkujący.
-
Reprezentacje dynamiczne podpisu odręcznego
PublicationZdefiniowano zespolone reprezentacje dynamiczne podpisu składanego odręcznie, zarejestrowanego za pomocą tabletu graficznego. Przedstawiono metody uzyskiwania tych reprezentacji oraz metody wspomagające ocenę zgodności aktualnych podpisów z wzorcem. Omówiono również zalety i wady tych metod. Zaprezentowano wyniki działania oryginalnych algorytmów przetwarzania i podejmowania decyzji, zaimplementowanych w środowisku MATLAB.
-
Cyfrowy filtr Hilberta i jego zastosowania
PublicationZaproponowano efektywne rozwiązanie filtru Hilberta o skończonej odpowiedzi impulsowej i o zmiennym opóźnieniu ułamkowym. Oryginalność polega tu na tym, że filtr równocześnie realizuje filtrację zespoloną Hilberta i opóźnianie ułamkowe wejściowego sygnału o wartościach rzeczywistych. Można go więc zastosować np. w systemie GPS lub w każdym innym systemie, gdzie zachodzi jednocześnie potrzeba filtracji Hilberta i estymacji opóźnienia...
-
Visual Traffic Noise Monitoring in Urban Areas
PublicationThe paper presents an advanced system for railway and road traffic noise monitoring in metropolitan areas. This system is a functional part of a more complex solution designed for environmental monitoring in cities utilizing analyses of sound, vision and air pollution, based on a ubiquitous computing approach. The system consists of many autonomous, universal measuring units and a multimedia server, which gathers, processes and...
-
Searching for metric structure of musical files
PublicationCelem opisywanych prac jest porównanie efektywności wybranych metod sztucznej inteligencji w wyznaczaniu rytmu dla zapisu symbolicznego muzyki. Opisano sposób wykorzystania sztucznych sieci neuronowych i zbiorów przybliżonych do poszukiwania właściwej struktury rytmicznej utworu. Analizowane są fizyczne atrybuty dźwięku, które są najbardziej znaczące dla określenia położenia dźwięku na pozycji akcentowanej lub nieakcentowanej....
-
Teleinformatyczna akwizycja i przetwarzanie danych dla potrzeb diagnostyki środowiska aglomeracji miejskich
PublicationRozdział przedstawia koncepcję aktualnie opracowywanego systemu służącego do monitorowania hałasu i ruchu drogowego w aglomeracjach miejskich, stanowiącego funkcjonalną część szerszego rozwiązania dotyczącego monitorowania środowiska w miastach. System taki składa się z rozmieszczonych w mieście autonomicznych i uniwersalnych stacji monitorujących oraz serwera gromadzącego, przetwarzającego i prezentującego wyniki z wykorzystaniem...
-
Speech codec enhancements utilizing time compression and perceptual coding
PublicationA method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband...
-
New generation artificial larynx
PublicationCelem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz....
-
Computational intelligence-aided character animation
PublicationW pracy przedstawiono pokrótce metody animacji komputerowej, a także podano zasady oceny jakości wyniku animacji postaci. Dodatkowo dokonano przeglądu metod inteligentnych stosowanych w animacji komputerowej i w dziedzinach pokrewnych. W badaniach skupiono się na animacji ruchu w kontekście uzyskiwanej ekspresji. Podano reguły stosowane w animacji tradycyjnej oraz wyznaczono parametry opisujące fazy ruchu w odniesieniu do poszczególnych...
-
Monitoring stanu środowiska - nowe szanse technologiczne
PublicationNadrzędnym celem projektu realizowanego aktualnie w Katedrze Systemów Multimedialnych Politechniki Gdańskiej jest perspektywiczne ograniczenie częstości występowania chorób słuchu i dolegliwości powodowane nadmiernym hałasem przemysłowym, urbanistycznym oraz skutkami nasilonego ruchu drogowego i zanieczyszczeniem powietrza spalinami. W toku realizacji projektu są wykorzystywane najnowsze technologie teleinformatyczne
-
Special hearing aid for stuttering people
PublicationDzięku postępowi w dziedzienie cyfrowego przetwarzania sygnałów możliwe stało zbudowanie subminiaturowego urządzenia łączącego funkcje aparatu słuchowego i korektora mowy. Takie urządzenie, mimo niewielkich rozmiarów, jest w stanie wykonywać skomplikowane alggorytmy a jego oprogramowanie może być łatwo zmieniane. W pracy skupiono się na zagadnieniach związanych z opracowniem prototypu i implementacją algorytmów korekcji słuchu...
-
Automatic singing voice recognition employing neural networks and rough sets
PublicationCelem prac opisanych w referacie jest automatyczne rozpoznawanie głosów śpiewaczych. Do tego celu utworzona została baza nagrań próbek śpiewu profesjonalnego i amatorskiego. Próbki poddane zostały parametryzacji parametrami zaproponowanymi przez autorów ściśle do tego celu. Sposób wyznaczenia parametrów i ich interpretacja fizyczna przedstawione są w referacie. Parametry wprowadzane są do systemów decyzyjnych, klasyfikatorów opartych...
-
Detection and segmentation of moving vehicles and trains using Gaussian mixtures, shadow detection and morphological processing
PublicationSolution presented in this paper combines background modelling, shadow detection and morphological and temporal processing into one system responsible for detection and segmentation of moving objects recorded with a static camera. Vehicles and trains are detected based on their pixellevel difference from the continually updated background model utilizing a Gaussian mixture calculated separately for every pixel. The shadow detection...
-
Multimedia noise monitoring system
PublicationW artykule przedstawiono Multimedialny System Monitorowania Hałasu. Projekt jest sieciocentrycznym systemem dedykowanym monitorowaniu zagrożeń hałasem. Jego nadrzędnym celem jest zwiększenie skuteczności w zakresie profilaktyki chorób słuchu. Umożliwia pobieranie, gromadzenie, analizę i wizualizację danych dotyczących hałasu, pobieranych ze zdalnych urządzeń pomiarowych oraz elektronicznych ankiet dostępnych przez Internet. Ponadto...
-
Applying computational intelligence to acoustics.
PublicationW artykule przedstawiono przegląd wybranych zagadnień związanych z zastosowaniem metod inteligencji obliczeniowej w akustyce. Zaprezentowane metody obejmują m.in. sztuczne sieci neuronowe, zbiory przyblizone, logikę rozmytą, algorytmy genetyczne. Problematyka akustyczna dotyczy z kolei klasyfikacji dźwięków muzycznych, inteligentnego przetwarzania muzyki, inteligentnego sterowania trakturą organową oraz obiektywizacji metody oceny...
-
A system for singing training
PublicationThe system proposed is aimed at the vocal students and persons who want to improve emission of their voices. The goal is not to substituite a singing teacher but to provide a tool for automatic teaching of voice emission basics. In this way singers can develop their vocal skills and improve them. By a visual feedback a student can control and modify vocal tract maximas (resonances) of a chosen vowel to match the resonances of the...
-
Multimedia Applications for the Hearing Impaired.
PublicationJednym z elementów przeciwdziałania szybko narastającym zagrożeniom niedosłuchem są aplikacje oprate na nowoczesnych technologiach. W wyniku współpracy Katedry Systemów Multimedialnych PG z warszawskim Instytutem Fizjologii i Patologii Słuchu opracowano wdrożone na szeroką skale multimedialne systemy przesiewowych badań zmysłów komunikowania się. Ponadto, nowsze opracowania dotyczą maskowania szumów usznych z wykorzystaniem linearyzacji...
-
Novel approaches to wideband speech coding
PublicationDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Ocena wpływu zagrożeń hałasowych na częstość występowania chorób słuchu z zastosowaniem systemów teleinformatycznych
Publication.
-
Identification of regions of interest in video for a traffic monitoring system
PublicationA system for automatic event detection in the camera image is presented in this paper. A method of limiting a region of interest to relevant parts of the image using a set of processing procedures is proposed. Image processing includes object detection with shadow removal performed in the modified YCbCr color space instead of RGB. The proposed procedures help to reduce the complexity of image processing algorithm and result in...
-
MTS pilot tone tracking for "wow" distortion determination
PublicationArtykuł przedstawia nowy algorytm do wyznaczania charakterystyki kołysania dźwięku na podstawie śledzenia zmian tonu pilota MTS. Śledzenie zmian częstotliwości nośnej tonu MTS pozwala określić zmienną w czasie głębokość pasożytniczych modulacji częstotliwości będących konsekwencją kołysania. Na tej podstawie tworzona jest charakterystyka zniekształcenia. Proponowany algorytm bazuje na zaproponowanej wcześniej metodzie śledzenie...
-
Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej
PublicationW pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.
-
Drift, wow and flutter measurement and reduction in shrunken movie soundtracks
PublicationReferat przedstawia metodę i algorytmy do oceny i redukcji dryfu, kołysania i drżenia w skurczonych taśmach filmowych. Przedstawione algorytmy działają w oparciu o przetwarzaniu obrazu taśmy filmowej w celu wyznaczenia jej lokalnego skurczu, który jest jednym z powodów powstawania dryfu, kołysania i drżenia. Lokalny skurcz taśmy można wyznaczyć dzięki analizie wysokości: ramki obrazu, perforacji, lub innego, standaryzowanego elementu...
-
Objects classification based on their physical sizes for detection of events in camera images
PublicationIn the paper, a method of estimation of the physical sizes of the objects tracked in the video surveillance system, and a simple module for object classification based on the estimated physical sizes, are presented. The results of object classification are then used for automatic detection of various types of events in the camera image.
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Modulation frequency constraints on wow and flutter determination
PublicationOpracowane wcześniej algorytmy do określania charakterystyki kołysania i drżenia dźwięku okazały się pomocne w rekonstrukcji rzeczywistych próbek dźwiękowych, jednakże przy ich opracowaniu nie określono przedziału częstotliwości modulujących, które mogą być przez nie śledzone. Prezentowany artykuł zawiera studium pozwalające wyznaczyć brakujące przedziały częstotliwości dla trzech algorytmów śledzących: przydźwięk sieciowy, pozostałość...
-
WYKORZYSTANIE SIECI NEURONOWYCH DO SYNTEZY MOWY WYRAŻAJĄCEJ EMOCJE
PublicationW niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opartych na mowie i możliwości ich wykorzystania w syntezie mowy z emocjami, wykorzystując do tego celu sieci neuronowe. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy mowy za pomocą sieci neuronowych. Obecnie obserwuje się znaczny wzrost zainteresowania i wykorzystania uczenia głębokiego w aplikacjach związanych...