Filtry
wszystkich: 803
-
Katalog
- Publikacje 512 wyników po odfiltrowaniu
- Czasopisma 9 wyników po odfiltrowaniu
- Konferencje 3 wyników po odfiltrowaniu
- Osoby 29 wyników po odfiltrowaniu
- Wynalazki 2 wyników po odfiltrowaniu
- Projekty 3 wyników po odfiltrowaniu
- Laboratoria 2 wyników po odfiltrowaniu
- Zespoły Badawcze 1 wyników po odfiltrowaniu
- Kursy Online 64 wyników po odfiltrowaniu
- Wydarzenia 9 wyników po odfiltrowaniu
- Dane Badawcze 169 wyników po odfiltrowaniu
Wyniki wyszukiwania dla: KODOWANIE AUDIO
-
JOURNAL OF THE AUDIO ENGINEERING SOCIETY
Czasopisma -
Kodowanie kanałowe w cyfrowych systemach komórkowych
PublikacjaW referacie przedstawiono metody kodowania kanałowego stosowane w systemach komórkowych. Zaprezentowano kody splotowe stosowane w systemie komórkowym GSM i podsystemach GPRS i EDGE. Przedstawiono również kody splotowe i turbokody stosowane w systemie UMTS i standardzie LTE.
-
A hybrid speech codec employing parametric and perceptual coding techniques
PublikacjaW referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...
-
Budowanie relacji partnerskich
PublikacjaArtykuł opisuje rzemieślniczą sztukę budowania relacji partnerskich na polskich uczelniach. W tym celu posłużono się doświadczeniami Politechniki Gdańskiej - opracowano trójkąt relacji partnerskich pod kątem braku relacji partnerskich pomiędzy poszczególnymi grupami relacji uczelnianych: "Obserwując zmiany zachodzące w społeczeństwie można zauważyć, iż wśród ludzi wzrasta świadomość znaczenia dobrych relacji wzajemnych. Trend ten...
-
EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY
PublikacjaThe problem of video framerate and audio/video synchronization in audio-visual speech recognition is considered. The visual features are added to the acoustic parameters in order to improve the accuracy of speech recognition in noisy conditions. The Mel-Frequency Cepstral Coefficients are used on the acoustic side whereas Active Appearance Model features are extracted from the image. The feature fusion approach is employed. The...
-
EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY
PublikacjaThe problem of video framerate and audio/video synchronization in audio-visual speech recogni-tion is considered. The visual features are added to the acoustic parameters in order to improve the accuracy of speech recognition in noisy conditions. The Mel-Frequency Cepstral Coefficients are used on the acoustic side whereas Active Appearance Model features are extracted from the image. The feature fusion approach is employed. The...
-
Bożena Kostek prof. dr hab. inż.
Osoby -
Tensor-product versus geometric-product coding
PublikacjaKodowanie przy pomocy iloczynów tensorowych, a kodowanie przy pomocy iloczynów geometrycznych. Formalizm jest zilustrowany przy pomocy paru przykładów.
-
Kreowanie zmian systemów produkcyjnych
PublikacjaUmiejętność szybkiej identyfikacji czynników zmiany i budowania impulsów sprawczych zmian pozwala na elastyczną adaptację systemu produkcyjnego do warunków globalnego rynku i budowanie przewagi konkurencyjnej. Kreowanie zmian systemów produkcyjnych wspiera metodyka identyfikacji czynników transformacji, której podstawę stanowi badanie wzajemnego wpływu zmian wielowymiarowych przestrzeni otoczenia i elementów systemu produkcyjnego.
-
Retrospecting Polish Audio Engineering Society Membership on 20th Anniversary of the Polish Section of the Audio Engineering Society
PublikacjaIn this article some key events concerning founding Polish Section of the Audio Engineering Society were presented. In addition, the history covering International Symposia on Sound Engineering and Mastering was outlined. Also, papers contained in this issue were shortly reviewed.
-
Objectivization of Audio-Visual Correlation analysis
PublikacjaSimultaneous perception of audio and visual stimuli often causes the concealment or misrepresentation of information actually contained in these stimuli. Such effects are called the ''image proximity effect'' or the ''ventriloquism effect'' in literature. Until recently, most research carried out to understand their nature was based on subjective assessments. The Authors of this paper propose a methodology based on both subjective...
-
Automatic audio-visual threat detection
PublikacjaThe concept, practical realization and application of a system for detection and classification of hazardous situations based on multimodal sound and vision analysis are presented. The device consists of new kind multichannel miniature sound intensity sensors, digital Pan Tilt Zoom and fixed cameras and a bundle of signal processing algorithms. The simultaneous analysis of multimodal signals can significantly improve the accuracy...
-
Measurement of Latency in the Android Audio Path
PublikacjaThis paper provides a description of experimental investigations concerning comparison between the audio path characteristics of various Android versions. First, information about the changes in each system version in the context of latency caused by them is presented. Then, a measurement procedure employing available applications to measure latency is described comparing to results contained in the Internet. Finally, a comparison...
-
Analiza efektywności kodowania kanałowego w systemie UMTS
Publikacja.
-
Automatic system for audio-video material reconstruction and archiving
PublikacjaReferat przedstawia propozycję modelu systemu automatycznej archiwizacji i rekonstrukcji nagrań audio-wideo. Założeniem tego rozwiązania jest uczynienie procesu rekonstrukcji nagrań bardziej niezależnym od człowieka. Ma to na celu redukcję kosztów rekonstrukcji przetwarzanych nagrań. Z powodu dużej liczby archiwalnych nagrań audio-wideo istnieje potrzeba stworzenia systemu który umożliwi automatyczną indeksację ich treści. Pomoże...
-
Journal of the Audio Engineering Society
Czasopisma -
Journal of Radio & Audio Media
Czasopisma -
Budowanie zaufania w relacjach interentowych
PublikacjaArtykuł prezentuje znaczenie zaufania w relacjach interpersonalnych oraz wpływ globalizacji na proces budowania i percepcji zaufania pomiędzy uczestnikami relacji społecznych. Przedstawiono badania własne, w których autorka zweryfikowała postawy badanych wobec zaufania w relacjach internetowych i poziom wiarygodności partnera w komunikacji odbywającej się z wykorzystaniem różnych internetowych funkcjonalności (forum internetowe,...
-
An new method of audio-visual correlation analysis
PublikacjaThis paper presents a new methodology of conducting the audio-visual correlation analysis employing the gaze tracking system. Interaction between two perceptual modalities, seeing and hearing, their interaction and mutual reinforcement in a complex relationship was a subject of many research studies. Earlier stage of the carried out experiments at the Multimedia Systems Department (MSD) showed that there exists a relationship between...
-
A double-talk detector using audio watermarking
Publikacjaa novel approach to double-talk detection in the acoustic echo canceler is proposed. a hidden signature is embedded into the arriving signal, using the echo-hiding method. next detection of the presence of this signature in the microphone signal is performed. the results of the signature detection may be used by the acoustic echo canceler to stop or restart the adaptation process.
-
Personal adaptive tuning of mobile computer audio
PublikacjaAn integrated methodology for enhancing audio quality in mobile computers is presented. The key features are adaptation of the characteristics of the acoustic track to the changing conditions and to the user's individual preferences. Original signal processing algorithms are introduced, which concern: linearization of frequency response, dialogue intelligibility enhancement and dynamics processing tuned up to the user's preferences....
-
Detection of impulsive disturbances in archive audio signals
PublikacjaIn this paper the problem of detection of impulsive disturbances in archive audio signals is considered. It is shown that semi-causal/noncausal solutions based on joint evaluation of signal prediction errors and leave-one-out signal interpolation errors, allow one to noticeably improve detection results compared to the prediction-only based solutions. The proposed approaches are evaluated on a set of clean audio signals contaminated...
-
Multimodal Audio-Visual Recognition of Traffic Events
PublikacjaPrzedstawiono demonstrator systemu wykrywania niebezpiecznych zdarzeń w ruchu drogowym oparty na jednoczesnej analizie danych wizyjnych i akustycznych. System jest częścią systemu automatycznego nadzoru bezpieczeństwa. Wykorzystuje on kamery i mikrofony jako źródła danych. Przedstawiono wykorzystane algorytmy - algorytmy rozpoznawania zdarzeń dźwiękowych oraz analizy obrazu. Zaprezentowano wyniki działania algorytmów na przykładzie...
-
Intelligent video and audio applications for learning enhancement
PublikacjaThe role of computers in school education is briefly discussed. Multimodal interfaces development history is shortly reviewed. Examples of applications of multimodal interfaces for learners with special educational needs are presented, including interactive electronic whiteboard based on video image analysis, application for controlling computers with facial expression and speech stretching audio interface representing audio modality....
-
Objectivization of audio-video correlation assessment experiments
PublikacjaThe purpose of this paper is to present a new method of conducting an audio-visual correlation analysis employing a head-motion-free gaze tracking system. First, a review of related works in the domain of sound and vision correlation is presented. Then assumptions concerning audio-visual scene creation are shortly described. The objectivization process of carrying out correlation tests employing gaze-tracking system is outlined....
-
A Study on Audio Signal Processed by "Instant Mastering"
PublikacjaAn increasing amount of music produced in home- and project-studios results in development and growth of "automatic mastering services". The presented investigation explores changes introduced to audio signal by various online mastering platforms. A music set consisting of 10 songs produced in small facilities was processed by eight on-line automatic mastering services. Additionally, some laboratory-constructed signals were tested....
-
A Device for Measuring Auditory Brainstem Responses to Audio
PublikacjaStandard ABR devices use clicks and tone bursts to assess subjects’ hearing in an objective way. A new device was developed that extends the functionality of a standard ABR audiometer by collecting and analyzing auditory brainstem responses (ABR). The developed accessory allows for the use of complex sounds (e.g., speech or music excerpts) as stimuli. Therefore, it is possible to find out how efficiently different types of sounds...
-
Adaptive filter for reconstruction of stereo audio signals.
PublikacjaArtykuł poświęcony jest omówieniu metody rekonstrukcji zakłóconych impulsowo sygnałów stereofonicznych. W pracy zdefiniowano model sygnału stereofonicznego i przedstawiono zaprojektowany dla tego modelu filtr Kalmana. Przedstawiono modyfikacje filtru, w wyniku których algorytm dokonuje rekonstrukcji zakłóconego impulsowo sygnału w jednym kanale z wykorzystaniem dodatkowej informacji zawartej w niezakłóconych próbkach sygnału pochodzącego...
-
Intelligent algorithms for optical track audio restoration
PublikacjaW referacie przedstawiono dwa algorytmy dedykowane redukcji pasożytniczych zniekształceń dźwięku spotykanych w optycznych ścieżkach dźwiękowych. Pierwszy algorytm umożliwia redukcję szerokopasmowego szumu w nagraniach fonicznych. Wykorzystano w nim psycho-akustyczny model słuchu oparty o miarę nieprzewidywalność sygnału (ang. Unpredictability Measure). Ocena jakości redukcji szumu została wykonana z wykorzystaniem metod inteligentnych....
-
Re:Brick, czyli budowanie z małych elementów
PublikacjaArtukuł opisuje problematykę aktywizowania działań łaczacych różne podmioty (studenci architektury i innych kierunków, praktykujący architekci, organizacje społeczne, administracja) mających przyczynić się podniesienia walorów architektonicznych i standardu zamieszkiwania w historycznych dzielnicach Gdańska (Dolne Miasto, Nowy Port, Biskupia Górka, Dolny Wrzeszcz).
-
EURO 2012 - kreowanie produktu turystyki sportowej
PublikacjaJedną z form aktywnego spędzania wolnego czasu jest turystyka sportowa. Najważniejszą grupą turystów w tym wypadku są kibice sportowi, a przedmiotem ich konsumpcji są wydarzenia sportowe, np. Mistrzostwa Europy w piłce nożnej. W takim rozumieniu wydarzenie sportowe stanowi produkt turystyczny, którego wykreowanie jest niesłychanie trudnym zadaniem, co wynika przede wszystkim z faktu, iż jest w nie zaangażowane wiele niezależnych...
-
Budowanie zespołu wirtualnego - zasady i wyzwania
PublikacjaArtykuł dotyczy tworzenia i współpracy w zespole wirtualnym, który jest zaangażowany w realizację konkretnego celu, najczęściej projektu, wymagającego współdziałania osób rozproszonych geograficznie i / lub organizacyjnie, komunikujących się głównie za pomocą technologii IT. Zaprezentowano charakterystykę wirtualnej współpracy z uwzględnieniem zalet i zagrożeń wynikających z ograniczenia komunikacji bezpośredniej. Na podstawie...
-
Public relations uczelni: kreowanie tożsamości wizualnej
PublikacjaPraca jest analizą podstawowych, najczęściej popełnianych błędów, w procesie kreowania tożsamości wizualnej przez uczelnie polskie. Praca jednocześnie podkreśla rangę umiejętnie wykreowanej i stosowanej tożsamości wizualnej jako jednego z elementów public relations.
-
Audio codec employing frequency-derived tonality measure
PublikacjaA transform codec employing efficient algorithm for detection of spectral tonal components is presented. The tonality measure used in MPEG psychoacoustic model is replaced with the method providing adequate tonality estimates even if the tonal components are deeply frequency modulated. The reliability of hearing threshold estimated using psychoacoustic model with standardized tonality measure and the proposed one is investigated...
-
Elimination of impulsive disturbances from stereo audio recordings
PublikacjaThis paper presents a new approach to elimination of impulsive disturbances from stereo audio recordings. The proposed solution is based on vector autoregressive modeling of audio signals. On-line tracking of signal model parameters is performed using the stability-preserving Whittle-Wiggins-Robinson algorithm with exponential data weighting. Detection of noise pulses and model-based interpolation of the irrevocably distorted samples...
-
Wireless intelligent audio-video surveillance prototyping system
PublikacjaThe presented system is based on the Virtex6 FPGA and several supporting devices like a fast DDR3 memory, small HD camera, microphone with A/D converter, WiFi radio communication module, etc. The system is controlled by the Linux operating system. The Linux drivers for devices implemented in the system have been prepared. The system has been successfully verified in a H.264 compression accelerator prototype in which the most demanding...
-
Using concentrated spectrogram for analysis of audio acoustic signals
PublikacjaThe paper presents results of time-frequency analysis of audio acoustic signals using the method of Concentrated Spectrograph also known as ''Cross-spectral method'' or ''Reassignment method''. Presented algorithm involves signal's local group delay and channelized instantaneous frequency to relevantly redistribute all Short-time Fourier transform lines in time-frequency plain. The main intention of the paper is to compare various...
-
Audio content analysis in the urban area telemonitoring system
PublikacjaArtykuł przedstawia możliwości rozwinięcie monitoringu miejskiego o automatyczną analizę dźwięku. Przedstawiono metody parametryzacji dźwięku, które możliwe są do zastosowania w takim systemie oraz omówiono aspekty techniczne implementacji. W kolejnej części przedstawiono system decyzyjny oparty na drzewach zastosowany w systemie. System ten rozpoznaje dźwięki niebezpieczne (strzał, rozbita szyba, krzyk) wśród dźwięków zarejestrowanych...
-
Exploiting audio-visual correlation by means of gaze tracking
PublikacjaThis paper presents a novel means for increasing audio-visual correlation analysis reliability. This is done based on gaze tracking technology engineered at the Multimedia Systems Department of the Gdansk University of Technology, Poland. In the paper, the past history and current research in the area of audio-visual perception analysis are shortly reviewed. Then the methodology employing gaze tracking is presented along with the...
-
Digital Audio Broadcasting or Webcasting: A Network Quality Perspective
PublikacjaIn recent years, many alternative technologies of delivering audio content have emerged, with different advantages and disadvantages. In this paper pros and cons of digital audio broadcasting and webcasting transmission techniques in a network quality perspective are described. A case study of user expectations with respect to currently available services is analyzed, and the perceived quality of real digital broadcasted and webcasted...
-
Analysis of allophones based on audio signal recordings and parameterization
PublikacjaThe aim of this study is to develop an allophonic description of English plosive consonants based on recordings of 600 specially selected words. Allophonic variations addressed in the study may have two sources: positional and contextual. The former one depends on the syllabic or prosodic position in which a particular phoneme occurs. Contextual allophony is conditioned by the local phonetic environment. Co-articulation overlapping...
-
An audio-visual corpus for multimodal automatic speech recognition
Publikacjareview of available audio-visual speech corpora and a description of a new multimodal corpus of English speech recordings is provided. The new corpus containing 31 hours of recordings was created specifically to assist audio-visual speech recognition systems (AVSR) development. The database related to the corpus includes high-resolution, high-framerate stereoscopic video streams from RGB cameras, depth imaging stream utilizing Time-of-Flight...
-
Applications of neural networks and perceptual masking to audio restoration
PublikacjaOmówiono zastosowania algorytmów uczących się w dziedzinie rekonstruowania nagrań fonicznych. Szczególną uwagę zwrócono na zastosowanie sztucznych sieci neuronowych do usuwania zakłócających impulsów. Ponadto opisano zastosowanie inteligentnego algorytmu decyzyjnego do sterowania maskowaniem perceptualnym w celu redukowania szumu.
-
Wow detection and compensation employing spectral processing of audio.
PublikacjaPraca zawiera opis opracowanych algorytmów detekcji i kompensacji pasożytniczych modulacji częstotliwości wynikających z nierównomiernego przesuwu nośnika dźwięku. Proponowane metody opracowano ze szczególnym uwzględnieniem przypadkowych zniekształceń drżenia obecnych w archiwalnych filmowych ścieżkach dźwiękowych. Dodatkowo algorytmy badają wpływ zniekształceń na strukturę formantową sygnałów. Analiza zmian położenia formantów...
-
New algorithms for wow and flutter detection and compensation in audio
PublikacjaW referacie przedstawiono nowe metody dyskryminacji naturalnych efektów muzycznych i pasożytniczych zniekształceń drżenia dźwięku. Dodatkowo, opisano w nim metody wyznaczania przebiegu zniekształceń drżenia. Wśród nich znajdują się: detekcja okresowości sygnału w poszczególnych ramkach czasowych, śledzenie zmian przydźwięku sieciowego wykorzystujące modelowane AR widma sygnału, śledzenie zmian wysokoczęstotliwościowego prądu podkładu....
-
New algorithms for wow and flutter detection and compensation in audio
PublikacjaW referacie przedstawiono nowe metody dyskryminacji naturalnych efektów muzycznych i pasożytniczych zniekształceń drżenia dźwięku. Dodatkowo, opisano w nim metody wyznaczania przebiegu zniekształceń drżenia. Wśród nich znajdują się: detekcja okresowości sygnału w poszczególnych ramkach czasowych, śledzenie zmian przydźwięku sieciowego wykorzystujące modelowane AR widma sygnału, śledzenie zmian wysokoczęstotliwościowego prądu podkładu....
-
Odbiornik adaptacyjny oraz nowe schematy kodowania w systemie TETRA
PublikacjaW artykule przedstawiono wyniki badania odbiornika adaptacyjnego dla systemu TETRA, przewidzianego do pracy z modulacjami fazowymi. Zaproponowano także nowe schematy kodowania w systemie z modulacjąπ/8-D8PSK. Przeprowadzone badania symulacyjne dla tych rozwiązań wykazały duże możliwości poprawy jakości odbioru.
-
Odbiornik adaptacyjny oraz nowe schematy kodowania w systemie tetra
PublikacjaW artykule przedstawiono wyniki badania odbiornika adaptacyjnego dla systemu TETRA, przewidzianego do pracy z modulacjami fazowymi. Zaproponowano także nowe schematy kodowania w systemie z modulacjąπ/8-D8PSK. Przeprowadzone badania symulacyjne dla tych rozwiązań wykazały duże możliwości poprawy jakości odbioru.
-
Uczenie poprzez auto-kodowanie w celu redukcji wymiarowości obrazu w zadaniach zaganiania
PublikacjaPraca dotyczy redukcji wymiarowości w problemie zaganiania (spychania) gromady złożonej z dużej liczby dynamicznych obiektów (ludzi, zwierząt, cząstek chemicznych, itp.) przez zespół aktywnych agentów. Proces zaganiania powinien spełniać określone kryteria, a algorytmy działania agentów uzyskiwane są na drodze uczenia. Przy dużej liczbie obiektów w gromadzie powstaje potrzeba redukcji wymiarowości poprzez ekstrakcję cech reprezentujących...
-
Kodowanie niedostarczonej do odbiorców informacji w systemach satelitarnych z wolnym kanałem zwrotnym
PublikacjaW poniższym artykule przedstawiono problem kodowania źródła satelitarnego opisany przez Birka i Kola. Przytoczono również nieoptymalne kodowanie dla postawionego problemu oraz miarę określającą możliwości takiego kodowania oraz kilka przykładów, w których wcześniej wspomniane kodowanie staje się optymalne.
-
IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING
Czasopisma -
Comptabilite Controle Audit
Czasopisma -
Improving signal quality in speech codec using hybrid perceptual-parametric algorithm. [Poprawa jakości sygnału w kodekach mowy przy użyciu hybrydowego, parametryczno-perceptualnego algorytmu kodowania]
PublikacjaPrzedstawiono hybrydową, parametryczno-perceptualną architekturę kodeka. Podstawowa struktura kodeka parametrycznego CELP została wzbogacona o kodowanie perceptualne. Celem hybrydyzacji kodeka jest uzyskanie znaczącej poprawy subiektywnej jakości zdekodowanego sygnału. Zaproponowano dwie hybrydowe struktury. Pierwsza polega na perceptualnym kodowaniu dźwięcznych elementów sygnału rezydualnego kodeka CELP. Druga metoda dzieli sygnał...
-
Sondowanie statyczne : Metody i zastosowanie w geoinżynierii.
PublikacjaKsiążka stanowi pierwsze polskie kompendium nt. sondowań statycznych metodą CPTU. Przedstawiono w niej problematykę sondowania w dwóch częściach: numerycznej i praktycznej. W części pierwszej autor zwraca uwagę na złożoność obliczeniową omawianych zagadnień, porusza kwestie zaawansowanej mechaniki obliczeniowej. Druga część zawiera wiele praktycznych wskazówek jak korzystać z metody CPTU i jak interpretować jej wyniki w celu określenia...
-
Kreowanie wizerunku wymiaru sprawiedliwości a sądowe sieci międzyorganizacyjne
PublikacjaCelem opracowania jest prezentacja: zależności pomiędzy pojęciami: tożsamość, wizerunek, reputacja, na gruncie sądownictwa, zasad kreowania wizerunku wymiaru sprawiedliwości, dobrych praktyk w budowaniu pozytywnego wizerunku wykorzystywanych przez sądy, poziomu dojrzałości sadów pilotażowych w zakresie stosowania działań wspierających wizerunek, roli i możliwości sieci międzyorganizacyjnych w transferze i ujednolicaniu dobrych...
-
Szybkie ładowanie samochodu elektrycznego z elektrowni słonecznej
PublikacjaW artykule przedstawiono stanowisko badawcze umożliwiające realizację procesu szybkiego ładowania samochodu elektrycznego. Wymagana energia jest wyprodukowana przez elektrownię słoneczną i przechowana w stacjonarnej baterii. Rozpatrzono trzy podstawowe sposoby ładowania samochodu elektrycznego: 1) ze stacjonarnej baterii ładowanej z elektrowni słonecznej, 2) ładowarką zasilaną ze stacjonarnej baterii i 3) ładowarką zasilaną ze...
-
MOST PODWIESZONY kreowanie przestrzeni i konsekwencje konstrukcyjne
PublikacjaProjektowanie i budowa - wyzwania dla projektantów i wykonawców mostów. Mosty podwieszone i wiszące ich estetyka i konsekwencje strukturalne. Artykuł dotyczy aspektów estetycznych i konstrukcyjnych zaprojektowanych pylonów dla mostów podwieszonych lub wiszących. Autor zwraca uwagę na fakt, że niezwykłe rozwiązanie konstrukcyjne zastosowane do kładki lub małego wiaduktu może działać prawidłowo dzięki zjawiskom efektu skali. Nadzwyczajne...
-
Dekodowanie kodów iterowanych z użyciem sieci neuronowej
PublikacjaNadmiarowe kody iterowane są jedną z prostych metod pozyskiwania długich kodów korekcyjnych zapewniających dużą ochronę przed błędami. Jednocześnie, chociaż ich podstawowy iteracyjny dekoder jest prosty koncepcyjnie oraz łatwy w implementacji, to nie jest on rozwiązaniem optymalnym. Poszukując alternatywnych rozwiązań zaproponowano, przedstawioną w pracy, strukturę dekodera tego typu kodów wspomaganą przez sieci neuronowe. Zaproponowane...
-
IEEE Transactions on Audio Speech and Language Processing
Czasopisma -
Two-stage method of impulsive noise detection for audio signals
PublikacjaPrzedstawiono nowa dwuetapową metodę detekcji zakłóceń impulsowych opartą na analizie funkcji gęstości rozkładu prawdopodobieństwa zakłóconego sygnału. Opisano algorytm określania poziomu wyzwalania detektora progowego.
-
Localization of impulsive disturbances in audio signals using template matching
PublikacjaIn this paper, a new solution to the problem of elimination of impulsive disturbances from audio signals, based on the matched filtering technique, is proposed. The new approach stems from the observation that a large proportion of noise pulses corrupting audio recordings have highly repetitive shapes that match several typical “patterns”. In many cases a representative set of exemplary pulse waveforms can be extracted from the...
-
Testing Watermark Robustness against Application of Audio Restoration Algorithms
PublikacjaThe purpose of this study was to test to what extent watermarks embedded in distorted audio signals are immune to audio restoration algorithm performing. Several restoration routines such as noise reduction, spectrum expansion, clipping or clicks reduction were applied in the online website system. The online service was extended with some copyright protection mechanisms proposed by the authors. They contain low-level music features...
-
Quality Evaluation of Novel DTD Algorithm Based on Audio Watermarking
PublikacjaEcho cancellers typically employ a doubletalk detection (DTD) algorithm in order to keep the adaptive filter from diverging in the presence of near-end speech signal or other disruptive sounds in the microphone signal. A novel doubletalk detection algorithm based on techniques similar to those used for audio signal watermarking was introduced by the authors. The application of the described DTD algorithm within acoustic echo cancellation...
-
Audio-visual surveillance system for application in bank operating room
PublikacjaAn audio-visual surveillance system able to detect, classify and to localize acoustic events in a bank operating room is presented. Algorithms for detection and classification of abnormal acoustic events, such as screams or gunshots are introduced. Two types of detectors are employed to detect impulsive sounds and vocal activity. A Support Vector Machine (SVM) classifier is used to discern between the different classes of acoustic...
-
Audio Feature Analysis for Precise Vocalic Segments Classification in English
PublikacjaAn approach to identifying the most meaningful Mel-Frequency Cepstral Coefficients representing selected allophones and vocalic segments for their classification is presented in the paper. For this purpose, experiments were carried out using algorithms such as Principal Component Analysis, Feature Importance, and Recursive Parameter Elimination. The data used were recordings made within the ALOFON corpus containing audio signal...
-
Objectivization of phonological evaluation of speech elements by means of audio parametrization
PublikacjaThis study addresses two issues related to both machine- and subjective-based speech evaluation by investigating five phonological phenomena related to allophone production. Its aim is to use objective parametrization and phonological classification of the recorded allophones. These allophones were selected as specifically difficult for Polish speakers of English: aspiration, final obstruent devoicing, dark lateral /l/, velar nasal...
-
System kodowania kształtu i identyfikacji obiektów za pomocą układu wizyjnego robota.
PublikacjaPrzedstawiono zagadnienie podejmowania przez robota chwytakiem z przestrzeni roboczej nieznanych obiektów i identyfikacji obiektów z opisanymi w bazie danych lub formułowanie nowych rekordów z danymi. Obiekty są dokumentowane za pomocą układu wizyjnego robota w postaci mapy bitowej. Na podstawie obrazu określane są kontury obiektu, a następnie odwzorowywane w przestrzeni jednowymiarowej i identyfikowane na podstawie bazy danych.
-
Further developments of parameterization methods of audio stream analysis for secuirty purposes
PublikacjaThe paper presents an automatic sound recognition algorithm intended for application in an audiovisual security monitoring system. A distributed character of security systems does not allow for simultaneous observation of multiple multimedia streams, thus an automatic recognition algorithm must be introduced. In the paper, a module for the parameterization and automatic detection of audio events is described. The spectral analyses...
-
Multimodal human-computer interfaces based on advanced video and audio analysis
PublikacjaMultimodal interfaces development history is reviewed briefly in the introduction. Examples of applications of multimodal interfaces to education software and for the disabled people are presented, including interactive electronic whiteboard based on video image analysis, application for controlling computers with mouth gestures and the audio interface for speech stretching for hearing impaired and stuttering people. The Smart...
-
System do prototypowania bezprzewodowych inteligentnych urządzeń monitoringu audio-video
PublikacjaW komunikacie przedstawiono system prototypowania bezprzewodowych urządzeń do monitoringu audio-video. System bazuje na układach FPGA Virtex6 i wielu dodatkowych wspierających urządzeniach jak: szybka pamięć DDR3, mała kamera HD, mikrofon z konwerterem A/C, moduł radiowy WiFi, itp. Funkcjonalność systemu została szczegółowo opisana w komunikacie. System został zoptymalizowany do pracy pod kontrolą systemu operacyjnego Linux, zostały...
-
Analysis of impact of audio modifications on the robustness of watermark for non-blind architecture
PublikacjaThe aim of this paper is to assess the robustness of the non-blind audio content watermarking scheme proposed by the authors. The authors present the architecture of the designed system along with the employed workflows for embedding and extracting the watermark followed by the implementation phase description and the analysis of the experimental results. Some possible attack simulations on the embedded watermarks are reviewed,...
-
Multimodal human-computer interfaces based on advanced video and audio analysis
PublikacjaMultimodal interfaces development history is reviewed briefly in the introduction. Some applications of multimodal interfaces to education software for disabled people are presented. One of them, the LipMouse is a novel, vision-based human-computer interface that tracks user’s lip movements and detect lips gestures. A new approach to diagnosing Parkinson’s disease is also shown. The progression of the disease can be measured employing...
-
Determining Pronunciation Differences in English Allophones Utilizing Audio Signal Parameterization
PublikacjaAn allophonic description of English plosive consonants, based on audio-visual recordings of 600 specially selected words, was developed. First, several speakers were recorded while reading words from a teleprompter. Then, every word was played back from the previously recorded sample read by a phonology expert and each examined speaker repeated a particular word trying to imitate correct pronunciation. The next step consisted...
-
Analysis of the Usefulness of Cheap Audio Recorders for Spectral Measurement of Environmental Noise
PublikacjaEnvironmental noise pollution is nowadays one of the most serious health threats. The impact of noise on the human body depends not only on the sound level but also on its spectral distribution. Reliable measurements of the environmental noise spectrum are often hampered by the very high price of top quality measuring devices. This paper explores the possibility of using much cheaper audio recorders for the frequency analysis....
-
Quality Analysis of Audio-Video Transmission in an OFDM-Based Communication System
PublikacjaApplication of a reliable audio-video communication system, brings many advantages. With the spoken word we can exchange ideas, provide descriptive information, as well as aid to another person. With the availability of visual information one can monitor the surrounding, working environment, etc. As the amount of available bandwidth continues to shrink, researchers focus on novel types of transmission. Currently, orthogonal frequency...
-
Noise reduction in audio employing spectral unpredictability measure and neural net.
Publikacjamodelu psychoakustycznym zostały przedyskutowane. Uczący się algorytm decyzjny, działający w opraciu o sztuczną sieć neuronową wykorzystany został w klasyfikacji składowych na pasożytnicze i użyteczne. Przedstawiona została również nowa iteracyjna procedura obliczania progu maskowania. W pracy zawarte zostały wyniki eksperymentów, oraz konkluzje odnoszące się do przedstawionych algorytmów.
-
Ochrona i budowanie potencjału zdrowia funkcjonariuszy służb mundurowych
PublikacjaCelem sympozjum autorskiego była identyfikacja skali i uwarunkowań problemów psychologicznych wpływających na efektywność pełnienia obowiązków służbowych oraz ocena roli psychologów ochronie zasobów osobowych funkcjonariuszy.
-
Zintegrowany napęd hydrauliczny w systemie wodowania łodzi ratunkowych
PublikacjaW artykule przedstawiono opis i schemat napędu i sterowania hydraulicznego innowacyjnego systemu ewakuacji ludzi z dużego statku pasażerskiego. System ten zlokalizowany na rufie statku obejmuje wyciągi łańcuchowe z zamocowanymi na nich dużymi łodziami ratunkowymi oraz pochylnię z rolkami, a także furto rampę rufową, stanowiącą po jej otwarciu przedłużenie pochylni, po której łodzie zjeżdżają do wody.
-
Budowanie miasta : rola urbanistów jako kluczowych aktorów procesu
PublikacjaW artykule przedstawiono współczesne role urbanistów - na tle szerokiej panoramy zagadnień związanych ze specyfiką współczesnych procesów wytwarzania przestrzeni.
-
Kreowanie wizerunku miasta przez działania rewitalizacyjne - przykład Gdańska
PublikacjaArtykuł wskazuje potencjał działań rewitalizacyjnych w procesie budowania wizerunku miasta. W tym kontekście podkreślono rolę city-marketingu, przywołując koncepcję miasta jako produktu. Zaakcentowano także różnicę pomiędzy marketingiem urbanistycznym a turystycznym. Ukazano również związek pomiędzy kreowaniem wizerunku miasta, a rozwojem przemysłów dóbr kultury oraz turystyką miejską. Koncentrując się na przykładzie Gdańska, wskazano...
-
Speech codec enhancements utilizing time compression and perceptual coding
PublikacjaA method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband...
-
High quality speech coding using combined parametric and perceptual modules. [Kodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego]
PublikacjaW komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne...
-
Localization of impulsive disturbances in archive audio signals using predictive matched filtering
PublikacjaThe problem of elimination of impulsive disturbances from archive audio signals is considered and its new solution, called predictive matched filtering, is proposed. The new approach is based on the observation that a large percentage of noise pulses corrupting archive audio recordings have highly repetitive shapes that match several typical “patterns”, called click templates. To localize noise pulses, click templates can be correlated...
-
Classifying type of vehicles on the basis of data extracted from audio signal characteristics
PublikacjaThe aim of this study is to find and optimize a feature vector for an automatic recognition of the type of vehicles, extracted form an audio signal. First, the influence of weather-based conditions of road surface on spectral characteristic of the audio signal recorded from a passing vehicle in close proximity to the road is discussed. Next, parameterization of the recorded audio signal is performed. For that purpose, the MIRtoolbox,...
-
RENOVATION OF ARCHIVE AUDIO RECORDINGS USING SPARSE AUTOREGRESSIVE MODELING AND BIDIRECTIONAL PROCESSING
PublikacjaThe paper presents a new approach to elimination of broadband noise and impulsive disturbances from archive audio recordings. The proposed adaptive Kalman-like algorithm, based on a sparse autoregressive model of the audio signal, simultaneously detects noise pulses, interpolates the irrevocably distorted samples and performs signal smoothing. It is shown that bidirectional (forward-backward) processing of the archive signal improves...
-
Elimination of Impulsive Disturbances From Archive Audio Signals Using Bidirectional Processing
PublikacjaIn this application-oriented paper we consider the problem of elimination of impulsive disturbances, such as clicks, pops and record scratches, from archive audio recordings. The proposed approach is based on bidirectional processing—noise pulses are localized by combining the results of forward-time and backward-time signal analysis. Based on the results of specially designed empirical tests (rather than on the results of theoretical analysis),...
-
Audio-visual aspect of the Lombard effect and comparison with recordings depicting emotional states.
PublikacjaIn this paper an analysis of audio-visual recordings of the Lombard effect is shown. First, audio signal is analyzed indicating the presence of this phenomenon in the recorded sessions. The principal aim, however, was to discuss problems related to extracting differences caused by the Lombard effect, present in the video , i.e. visible as tension and work of facial muscles aligned to an increase in the intensity of the articulated...
-
A study on of music features derived from audio recordings examples – a quantitative analysis
PublikacjaThe paper presents a comparative study of music features derived from audio recordings, i.e. the same music pieces but representing different music genres, excerpts performed by different musicians, and songs performed by a musician, whose style evolved over time. Firstly, the origin and the background of the division of music genres were shortly presented. Then, several objective parameters of an audio signal were recalled that...
-
Pomiary wartości opóźnień w torze audio urządzeń z systemem Android
PublikacjaPoniższy artykuł opisuje metody pomiarów wartości opóźnienia w torze fonicznym urządzeń pracujących na różnych wersjach systemu Android. W pierwszej części artykułu podano krótką charakterystykę środowiska Android w kontekście opóźnień w torze fonicznym. Następnie przedstawiono sposób pomiaru opóźnienia w torze fonicznym za pomocą aplikacji SuperPowered Latency oraz Dr. Rick O’Rang Loopback. W końcowej...
-
Audio Content and Crowdsourcing: A Subjective Quality Evaluation of Radio Programs Streamed Online
PublikacjaRadio broadcasting has been present in our lives for over 100 years. The transmission of speech and music signals accompanies us from an early age. Broadcasts provide the latest information from home and abroad. They also shape musical tastes and allow many artists to share their creativity. Modern distribution involves transmission over a number of terrestrial systems. The most popular are analog FM (Frequency Modulation) and...
-
Intelligent Audio Signal Processing − Do We Still Need Annotated Datasets?
PublikacjaIn this paper, intelligent audio signal processing examples are shortly described. The focus is, however, on the machine learning approach and datasets needed, especially for deep learning models. Years of intense research produced many important results in this area; however, the goal of fully intelligent signal processing, characterized by its autonomous acting, is not yet achieved. Therefore, a review of state-of-the-art concerning...
-
Intelligent acquisition of audio signals, employing neutral networks and rough set algorithms
PublikacjaAlgorytmy oparte na sztucznych sieciach neuronowych i metodzie zbiorówprzybliżonych zostały zastosowane do lokalizacji sygnałów fonicznych obar-czonych pasożytniczym szumem i rewerberacjami. Informacja o kierunku napły-wania dźwięku była uzyskiwana na wyjściach tych algorytmów na podstawie re-prezentacji parametrycznej. Przedstawiono wyniki eksperymentalne i przepro-wadzono ich dyskusję.
-
Zespołowe kreowanie wyrobu na przykładzie konstrukcji kosiarki do trawy
PublikacjaArtykuł przedstawia analizę zespołowej pracy konstruktorskiej w celu opracowania i eksploatacji kosiarki do trawy. Kosiarka została zbudowana w ramach tzw. Olimpiady kosiarkowej - konkursu organizowanego przez firmę Briggs&Stratton. W publikacji zawarto modele zespołowego kreowania wyrobu, jako wspólnej i twórczej myśli konstruktorów. Efektem pracy było stworzenie nowego urządzenia o zaprojektowanych walorach użytkowych i eksploatacyjnych...
-
Kreowanie miejsc pracy - czy jest to powód dla wspierania MSP?
PublikacjaKierując się dotychczasową wiedzą na temat roli sektora MSP w gospodarce, poddano analizie doniesienia światowej literatury, na temat związku pomiędzy przedsiębiorczością/MSP a liczbą miejsc pracy w gospodarce. Należy podkreślić, że nieczęsto w Polsce poddaje się w wątpliwość pozytywną relację pomiędzy tymi dwoma wielkościami, choć wyniki badań prowadzonych na świecie są niejednoznaczne. Wynikać to może z faktu, iż większość doniesień,...
-
Zespołowe kreowanie wyrobu na przykładzie konstrukcji kosiarki do trawy
PublikacjaArtykuł przedstawia proces zespołowego projektowania i wytwarzania zdalnie sterowanej kosiarki do trawy. Kosiarka została wykonana przez członków Koła Naukowego Mechanik Politechniki Gdańskiej w ramach konkursu organizowanego przez firmę Briggs&Stratton. W ogólnopolskim finale członkowie Koła zajęli drugie miejsce i otrzymali cenne nagrody.
-
Sondowanie statyczne metodą CPTU podłoża gruntowego pod nasypem drogowym.
PublikacjaW artykule przedstawiono sposób wykonania badania sondowania statycznego metodą CPTU przez nasyp drogowy w celu oszacowania warunków konsolidacji podłoża gruntowego.
-
Novel approaches to wideband speech coding
PublikacjaDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...
-
Parametric impulsive noise detector for corrupted audio signals based on hidden Markow model
PublikacjaThe paper addresses the problem of impulsive noise detection for audio signals. A structure of threshold parameter detectors using modelingof signals was introduced. the algorithm of the noise detection, based on discrete-time hidden Markow model (HMM)of whitened audio signal is elaborated
-
Gaze-tracking based audio-visual correlation analysis employing quality of experience methodology
PublikacjaThis paper investigates a new approach to audio-visual correlation assessment based on the gaze-tracking system developed at the Multimedia Systems Department (MSD) of Gdansk University of Technology (GUT). The gaze-tracking methodology, having roots in Human-Computer Interaction borrows the relevance feedback through gaze-tracking and applies it to the new area of interests, which is Quality of Experience. Results of subjective...
-
Sparse vector autoregressive modeling of audio signals and its application to the elimination of impulsive disturbances
PublikacjaArchive audio files are often corrupted by impulsive disturbances, such as clicks, pops and record scratches. This paper presents a new method for elimination of impulsive disturbances from stereo audio signals. The proposed approach is based on a sparse vector autoregressive signal model, made up of two components: one taking care of short-term signal correlations, and the other one taking care of long-term correlations. The method...