Filtry
wszystkich: 1052
wybranych: 721
Wyniki wyszukiwania dla: audiovisual speech recognition
-
Face Recognition: Shape versus Texture
PublikacjaThis paper describes experiments related to the application of well-known techniques of the texture feature extraction (Local Binary Patterns and Gabor filtering) to the problem of automatic face verification. Results of the tests show that simple image normalization strategy based on the eye center detection and a regular grid of fiducial points outperforms the more complicated approach, employing active models that are able to...
-
Role of cholesterol in substrate recognition by -secretase
Publikacja-Secretase is an enzyme known to cleave multiple substrates within their transmembrane domains, with the amyloid precursor protein of Alzheimer’s Disease among the most prominent examples. The activity of -secretase strictly depends on the membrane cholesterol content, yet the mechanistic role of cholesterol in the substrate binding and cleavage remains unclear. In this work, we used all-atom molecular dynamics simulations to examine...
-
System of speech signal processing and visualisation for linguistic purposes
Publikacja -
Digital analysis of ethnic speech – extraction of information code
Publikacja -
On the EM algorithm for the estimation of speech AR parameters in noise
Publikacja -
Investigations of speech signal parameters with regard to articulation influences
PublikacjaW pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...
-
Evaluation and Irony in Text in the Light of Speech Act Theory
Publikacja -
Detection of dialogue in movie soundtrack for speech intelligibility enhancement
PublikacjaA method for detecting dialogue in 5.1 movie soundtrack based on interchannel spectral disparity is presented. The front channel signals (left, right, center) are analyzed in the frequency domain. The selected partials in the center channel signal, which yield high disparity with left and right channels, are detected as dialogue. Subsequently, the dialogue frequency components are boosted to achieve increased dialogue intelligibility....
-
New approach to localization of clicks in archive speech signals.
PublikacjaPrzedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.
-
Advanced speech archiving and restoration system for aviation applications
PublikacjaW referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów - jest to niezwykle istotne w...
-
Application of hybrid signals processors to speech and hearing aids
PublikacjaDzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...
-
Automatic recognition of males and females among web browser users based on behavioural patterns of peripherals usage
PublikacjaPurpose The purpose of this paper is to answer the question whether it is possible to recognise the gender of a web browser user on the basis of keystroke dynamics and mouse movements. Design/methodology/approach An experiment was organised in order to track mouse and keyboard usage using a special web browser plug-in. After collecting the data, a number of parameters describing the users’ keystrokes, mouse movements and clicks...
-
The Influence of Selecting Regions from Endoscopic Video Frames on The Efficiency of Large Bowel Disease Recognition Algorithms
PublikacjaThe article presents our research in the field of the automatic diagnosis of large intestine diseases on endoscopic video. It focuses on the methods of selecting regions of interest from endoscopic video frames for further analysis by specialized disease recognition algorithms. Four methods of selecting regions of interest have been discussed: a. trivial, b. with the deletion of characteristic, endoscope specific additions to the...
-
Determination of toxic gases based on the responses of a single electrocatalytic sensor and pattern recognition techniques
PublikacjaA response from an electrocatalytic gas sensor contains fingerprint information about the type of gas and its concentration. As a result, a single gas sensor can be used for the determination of different gases. However, information about the type of gas and its concentration is hidden in the unique shape of the current–voltage response and it is quite difficult to explore. One of the ways to get precise information about the measured...
-
1D convolutional context-aware architectures for acoustic sensing and recognition of passing vehicle type
PublikacjaA network architecture that may be employed to sensing and recognition of a type of vehicle on the basis of audio recordings made in the proximity of a road is proposed in the paper. The analyzed road traffic consists of both passenger cars and heavier vehicles. Excerpts from recordings that do not contain vehicles passing sounds are also taken into account and marked as ones containing silence....
-
Real-time speech streching for supporting hearing impaired schoolchildren
PublikacjaA study of time scale modification algorithms applied to support hearing impaired schoolchildren is presented. Variety of algorithms are considered, namely: overlap-and add, two variations of synchronous overlapand- add, and the phase vocoder. Their effectiveness as well as real-time processing capabilities are examined.
-
Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language
PublikacjaPrzedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...
-
A hybrid speech codec employing parametric and perceptual coding techniques
PublikacjaW referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...
-
Recognition, understanding and aestheticization of freehand drawing flowcharts
PublikacjaIn this paper a concept of FCA, a system for recognizing, understanding and aestheticization of freehand drawing flow charts is described. The system is based on a proposed by the author FlowGram graph grammar describing flow charts drawing. An open format FlowChartML for flow charts description is also proposed. The aestheticization criterion is formulated that allows for automatic beautification of flow charts. First experiments...
-
Gazetteer compression technique based on substructure recognition
PublikacjaAutomaty skończone są najlepszą formą reprezentacji słowników do przetwarzania języka naturalnego. Przedstawiamy nową technikę kompresji, która jest szczególnie użyteczna w stosunku do pewnego rodzaju słowników. Zastępujemy wielokrotnie występujące podstruktury ich niepowtarzalnymi reprezentantami. Do ich znalezienia traktujemy wektor przejść jako tekst i stosujemy technikę kompresji tekstu w stylu Ziv-Lempel, która znajduje powtórzenia...
-
Multimodal Audio-Visual Recognition of Traffic Events
PublikacjaPrzedstawiono demonstrator systemu wykrywania niebezpiecznych zdarzeń w ruchu drogowym oparty na jednoczesnej analizie danych wizyjnych i akustycznych. System jest częścią systemu automatycznego nadzoru bezpieczeństwa. Wykorzystuje on kamery i mikrofony jako źródła danych. Przedstawiono wykorzystane algorytmy - algorytmy rozpoznawania zdarzeń dźwiękowych oraz analizy obrazu. Zaprezentowano wyniki działania algorytmów na przykładzie...
-
Acylic congener of cucurbituril: synthesis and recognition properties.
PublikacjaZaprezentowano syntezę analogów acyklicznych cucurbiturilu oraz ich zdolności do kompleksowania wybranych 16 amin, dioli, kwasów dikarboksylowych, pochodnych guanidyny oraz pirydyny. Obserwowane tworzenie kompleksów przebiegało około 180 razy słabiej niż dla cucurbiturilu. Wyniki te świadczą o potencjalnych możliwościach zbliżonych do analogów cyklicznych pod względem tworzenia kompleksów i rozpoznawania wyżej wymienionych...
-
Vowel recognition based on acoustic and visual features
PublikacjaW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...
-
Interactions of telomeric proteins with nucleic acids: sequence recognition on intact and oxidatively damaged telomeres
PublikacjaTelomeres are complex nucleoprotein assemblies that play a vital role in the maintenance of functional ends of linear chromosomes. Telomeric DNA, composed of tandem repeats of the 5'-TTAGGG-3' motif, solves the so-called end replication problem: as chromosomes shorten with each cell division, no information is lost, and the telomere can be re-extended. In the cell, many protein factors regulate telomere length, nuclear positioning...
-
Automatic Watercraft Recognition and Identification on Water Areas Covered by Video Monitoring as Extension for Sea and River Traffic Supervision Systems
PublikacjaThe article presents the watercraft recognition and identification system as an extension for the presently used visual water area monitoring systems, such as VTS (Vessel Traffic Service) or RIS (River Information Service). The watercraft identification systems (AIS - Automatic Identification Systems) which are presently used in both sea and inland navigation require purchase and installation of relatively expensive transceivers...
-
Luminescence recognition material as an INHIBIT logic gate in presence of Pb2+ and Cu2+ ions in aqueous solutions
PublikacjaA recognition material consisting of silica xerogel with amino-modified surface selectively recognizes Pb2+ and Cu2+ (but only in presence of Pb2+ ions) in aqueous solutions of other metal ions. The analytical action of the material is based on a significant change in luminescence emission spectra of the material after chemisorption of Pb2+ ions. In the presence of Pb2+ in octahedral coordination environment, a new broad and strong...
-
Speech formant frequency and pitch estimation using instantaneous complex frequency
PublikacjaW pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.
-
Time-scale modification of speech signals for supporting hearing impaired schoolchildren
PublikacjaA study of time scale modification algorithmsapplied to hearing impaired schoolchildren supporting ispresented. Variety of algorithms are considered, namely:overlap and add, two variations of synchronized overlapand add, and the phase vocoder. Their effectiveness as wellas real-time processing capabilities are examined.
-
Recognition Dynamics of Cancer Mutations on the ERp57-Tapasin Interface
Publikacja -
Gait Recognition: A Challenging Task for MEMS Signal Identification
Publikacja -
Buzz-based recognition of the honeybee colony circadian rhythm
Publikacja -
Recognition of input items to the logistic operations in accommodation services
PublikacjaIn this study the authors set themselves the aim to analyze the elements of the entrance to the accommodation services in terms of logistics. Therefore, providers of this type of services were examined. This allowed to carry out analyses also with including the variety of accommodation services
-
Multidimensional Scaling Analysis Applied to Music Mood Recognition
PublikacjaThe paper presents two experiments aimed at categorizing mood associated with music. Two parts of a listening test were designed and carried out with a group of students, most of whom where users of online social music services. The initial experiment was designed to evaluate the extent to which a given label describes the mood of the particular music excerpt. The second subjective test was conducted to collect the similarity data...
-
Mutual recognition of certification systems: The case of SERMO and ACLES
Publikacja -
Towards Recognition of Spatial Relations between Entities for Polish
Publikacja -
Evaluation of Knowledge-Based Recognition of Spatial Expressions for Polish
Publikacja -
Buzz-based recognition of the honeybee colony circadian rhythm
PublikacjaHoneybees are one of the highly valued pollinators. Their work as individuals is appreciated for crops pollination and honey production. It is believed that work of an entire bee colony is intense and almost continuous. The goal of the work presented in this paper is identification of bees circadian rhythm with a use of sound-based analysis. In our research as a source of information on bee colony we use their buzz that have been...
-
Camera-based Automatic System for Tool Measurements and Recognition
Publikacja -
Machine learning applied to bi-heterocyclic drugs recognition
Publikacja -
A Framework for Training and Testing of Complex Pattern Recognition Systems
PublikacjaW pracy przedstawiono szkielet aplikacji stworzony po to, by uprościć konstruowanie systemów rozpoznawania obrazów oraz zapewnić środowisko testowe umożliwiające ocenę algorytmów przy użyciu dużych zestawów danych. Jasno zdefiniowana architektura wraz z wieloma gotowymi do użycia modułami pozwala skoncentrować się na implementacji najważniejszych algorytmów. Szkielet wspiera tworzenie modułów, który mogą być wielokrotnie używane,...
-
Automatic recognition of the arterial input function in MRI studies
PublikacjaArtykuł prezentuje opis automatycznej metody detekcji tętniczej funkcji wejście (AIF). Metoda została porównana z klinicznie pomierzonymi seriami obrazów DSC-MRI.
-
Versatile pattern recognition system based on Fisher criterion
PublikacjaZaprezentowano system rozpoznawania obrazów w postaci bitmap. Zaimplementowany algorytm ekstrakcji cech jest uniwersalny i może być używany do różnych obrazów. Cały system bazuje na kryterium Fishera.
-
Recognition of hazardous acoustic events employing parallel processing on a supercomputing cluster . Rozpoznawanie niebezpiecznych zdarzeń dźwiękowych z wykorzystaniem równoległego przetwarzania na klastrze superkomputerowym
PublikacjaA method for automatic recognition of hazardous acoustic events operating on a super computing cluster is introduced. The methods employed for detecting and classifying the acoustic events are outlined. The evaluation of the recognition engine is provided: both on the training set and using real-life signals. The algorithms yield sufficient performance in practical conditions to be employed in security surveillance systems. The...
-
Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm
PublikacjaW artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...
-
Ontological Modeling for Contextual Data Describing Signals Obtained from Electrodermal Activity for Emotion Recognition and Analysis
PublikacjaMost of the research in the field of emotion recognition is based on datasets that contain data obtained during affective computing experiments. However, each dataset is described by different metadata, stored in various structures and formats. This research can be counted among those whose aim is to provide a structural and semantic pattern for affective computing datasets, which is an important step to solve the problem of data...
-
Poll Reader - the working prototype of optical mark recognition software
PublikacjaAutomatyczne rozpoznawanie zaznaczeń wydaje się stosunkowo prostym zadaniem z dziedziny przetwarzania dokumentów, a komercyjne systemy OMR są dostępne na rynku już od dłuższego czasu. Zdecydowaliśmy się jednak na stworzenie prostego darmowego oprogramowania, które mogłoby być wykorzystywane przez uczelnie zobowiązane do przeprowadzania ankiet wśród studentów. W rozdziale opisano konstrukcję programu oraz najważniejsze algorytmy...
-
Recognition of social health: A conceptual framework in the context of dementia research
Publikacja -
Face recognition by humans with gaze-tracking system Cyber-Eye
PublikacjaW celu dokładniejszego zrozumienia sposobu rozpoznawania i zapamiętywania twarzy przez człowieka przeprowadzono doświadczenie na grupie 20 osób z wykorzystaniem wcześniej opracowanego systemu śledzenia fiksacji wzroku Cyber-Oko [3]. Wykorzystując diody i kamerę podczerwieni wraz z dedykowanym oprogramowaniem Cyber-Oko, które pozwala na śledzenie punktu skupienia wzroku na ekranie. Każdej osobie biorącej udział w doświadczeniu pokazano...
-
Blur recognition using second fundamental form of image surface
Publikacja -
Lip movement and gesture recognition for a multimodal human-computer interface
Publikacja