Wyniki wyszukiwania dla: audiovisual speech recognition

Face Recognition: Shape versus Texture

Publikacja

M. Smiatacz

- Rok 2015

This paper describes experiments related to the application of well-known techniques of the texture feature extraction (Local Binary Patterns and Gabor filtering) to the problem of automatic face verification. Results of the tests show that simple image normalization strategy based on the eye center detection and a regular grid of fiducial points outperforms the more complicated approach, employing active models that are able to...

Pełny tekst do pobrania w serwisie zewnętrznym

Role of cholesterol in substrate recognition by -secretase

Publikacja

- Scientific Reports - Rok 2021

-Secretase is an enzyme known to cleave multiple substrates within their transmembrane domains, with the amyloid precursor protein of Alzheimer’s Disease among the most prominent examples. The activity of -secretase strictly depends on the membrane cholesterol content, yet the mechanistic role of cholesterol in the substrate binding and cleavage remains unclear. In this work, we used all-atom molecular dynamics simulations to examine...

Pełny tekst do pobrania w portalu

System of speech signal processing and visualisation for linguistic purposes

Publikacja

K. Wojan

- Archives of Acoustics - Rok 2005

Digital analysis of ethnic speech – extraction of information code

Publikacja

K. Wojan

- Archives of Acoustics - Rok 2003

On the EM algorithm for the estimation of speech AR parameters in noise

Publikacja

M. Kuropatwinski
B. Kleijn
M. Kuropatwiński

- Rok 2014

Pełny tekst do pobrania w serwisie zewnętrznym

Investigations of speech signal parameters with regard to articulation influences

Publikacja

A. Kaczmarek

- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Rok 2008

W pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...

Evaluation and Irony in Text in the Light of Speech Act Theory

Publikacja

K. Kukowicz-Zarska

- Forum Filologiczne Ateneum - Rok 2020

Pełny tekst do pobrania w serwisie zewnętrznym

Detection of dialogue in movie soundtrack for speech intelligibility enhancement

Publikacja

K. Łopatka

- Rok 2014

A method for detecting dialogue in 5.1 movie soundtrack based on interchannel spectral disparity is presented. The front channel signals (left, right, center) are analyzed in the frequency domain. The selected partials in the center channel signal, which yield high disparity with left and right channels, are detected as dialogue. Subsequently, the dialogue frequency components are boosted to achieve increased dialogue intelligibility....

Pełny tekst do pobrania w serwisie zewnętrznym

New approach to localization of clicks in archive speech signals.

Publikacja

- Rok 2004

Przedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.

Advanced speech archiving and restoration system for aviation applications

Publikacja

A. Czyżewski
J. Kotus
A. Kaczmarek
A. Rypulak
A. Pawlik

- Rok 2005

W referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów - jest to niezwykle istotne w...

Application of hybrid signals processors to speech and hearing aids

Publikacja

- Rok 2005

Dzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...

Automatic recognition of males and females among web browser users based on behavioural patterns of peripherals usage

Publikacja

A. Kołakowska
A. Landowska
P. Jarmolkowicz
M. Jarmolkowicz
K. Sobota

- Internet Research - Rok 2016

Purpose The purpose of this paper is to answer the question whether it is possible to recognise the gender of a web browser user on the basis of keystroke dynamics and mouse movements. Design/methodology/approach An experiment was organised in order to track mouse and keyboard usage using a special web browser plug-in. After collecting the data, a number of parameters describing the users’ keystrokes, mouse movements and clicks...

Pełny tekst do pobrania w serwisie zewnętrznym

The Influence of Selecting Regions from Endoscopic Video Frames on The Efficiency of Large Bowel Disease Recognition Algorithms

Publikacja

- Rok 2012

The article presents our research in the field of the automatic diagnosis of large intestine diseases on endoscopic video. It focuses on the methods of selecting regions of interest from endoscopic video frames for further analysis by specialized disease recognition algorithms. Four methods of selecting regions of interest have been discussed: a. trivial, b. with the deletion of characteristic, endoscope specific additions to the...

Determination of toxic gases based on the responses of a single electrocatalytic sensor and pattern recognition techniques

Publikacja

- MEASUREMENT SCIENCE & TECHNOLOGY - Rok 2014

A response from an electrocatalytic gas sensor contains fingerprint information about the type of gas and its concentration. As a result, a single gas sensor can be used for the determination of different gases. However, information about the type of gas and its concentration is hidden in the unique shape of the current–voltage response and it is quite difficult to explore. One of the ways to get precise information about the measured...

Pełny tekst do pobrania w serwisie zewnętrznym

1D convolutional context-aware architectures for acoustic sensing and recognition of passing vehicle type

Publikacja

- Rok 2020

A network architecture that may be employed to sensing and recognition of a type of vehicle on the basis of audio recordings made in the proximity of a road is proposed in the paper. The analyzed road traffic consists of both passenger cars and heavier vehicles. Excerpts from recordings that do not contain vehicles passing sounds are also taken into account and marked as ones containing silence....

Real-time speech streching for supporting hearing impaired schoolchildren

Publikacja

- Elektronika : konstrukcje, technologie, zastosowania - Rok 2010

A study of time scale modification algorithms applied to support hearing impaired schoolchildren is presented. Variety of algorithms are considered, namely: overlap-and add, two variations of synchronous overlapand- add, and the phase vocoder. Their effectiveness as well as real-time processing capabilities are examined.

Pełny tekst do pobrania w serwisie zewnętrznym

Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language

Publikacja

K. Łopatka
P. Suchomski
A. Czyżewski

- Elektronika : konstrukcje, technologie, zastosowania - Rok 2011

Przedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...

A hybrid speech codec employing parametric and perceptual coding techniques

Publikacja

- Rok 2006

W referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...

Recognition, understanding and aestheticization of freehand drawing flowcharts

Publikacja

W. Szwoch

- Rok 2007

In this paper a concept of FCA, a system for recognizing, understanding and aestheticization of freehand drawing flow charts is described. The system is based on a proposed by the author FlowGram graph grammar describing flow charts drawing. An open format FlowChartML for flow charts description is also proposed. The aestheticization criterion is formulated that allows for automatic beautification of flow charts. First experiments...

Gazetteer compression technique based on substructure recognition

Publikacja

J. Daciuk
J. Piskorski

- Rok 2006

Automaty skończone są najlepszą formą reprezentacji słowników do przetwarzania języka naturalnego. Przedstawiamy nową technikę kompresji, która jest szczególnie użyteczna w stosunku do pewnego rodzaju słowników. Zastępujemy wielokrotnie występujące podstruktury ich niepowtarzalnymi reprezentantami. Do ich znalezienia traktujemy wektor przejść jako tekst i stosujemy technikę kompresji tekstu w stylu Ziv-Lempel, która znajduje powtórzenia...

Pełny tekst do pobrania w serwisie zewnętrznym

Multimodal Audio-Visual Recognition of Traffic Events

Publikacja

- Rok 2011

Przedstawiono demonstrator systemu wykrywania niebezpiecznych zdarzeń w ruchu drogowym oparty na jednoczesnej analizie danych wizyjnych i akustycznych. System jest częścią systemu automatycznego nadzoru bezpieczeństwa. Wykorzystuje on kamery i mikrofony jako źródła danych. Przedstawiono wykorzystane algorytmy - algorytmy rozpoznawania zdarzeń dźwiękowych oraz analizy obrazu. Zaprezentowano wyniki działania algorytmów na przykładzie...

Acylic congener of cucurbituril: synthesis and recognition properties.

Publikacja

C. A. Burnett
D. Witt
J. C. Fettinger
L. Isaacs

- Asian Journal of Organic Chemistry - Rok 2003

Zaprezentowano syntezę analogów acyklicznych cucurbiturilu oraz ich zdolności do kompleksowania wybranych 16 amin, dioli, kwasów dikarboksylowych, pochodnych guanidyny oraz pirydyny. Obserwowane tworzenie kompleksów przebiegało około 180 razy słabiej niż dla cucurbiturilu. Wyniki te świadczą o potencjalnych możliwościach zbliżonych do analogów cyklicznych pod względem tworzenia kompleksów i rozpoznawania wyżej wymienionych...

Vowel recognition based on acoustic and visual features

Publikacja

- Archives of Acoustics - Rok 2006

W artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...

Pełny tekst do pobrania w portalu

Interactions of telomeric proteins with nucleic acids: sequence recognition on intact and oxidatively damaged telomeres

Publikacja

M. Wieczór

- Rok 2019

Telomeres are complex nucleoprotein assemblies that play a vital role in the maintenance of functional ends of linear chromosomes. Telomeric DNA, composed of tandem repeats of the 5'-TTAGGG-3' motif, solves the so-called end replication problem: as chromosomes shorten with each cell division, no information is lost, and the telomere can be re-extended. In the cell, many protein factors regulate telomere length, nuclear positioning...

Pełny tekst do pobrania w portalu

Automatic Watercraft Recognition and Identification on Water Areas Covered by Video Monitoring as Extension for Sea and River Traffic Supervision Systems

Publikacja

N. Wawrzyniak
A. Stateczny

- Polish Maritime Research - Rok 2018

The article presents the watercraft recognition and identification system as an extension for the presently used visual water area monitoring systems, such as VTS (Vessel Traffic Service) or RIS (River Information Service). The watercraft identification systems (AIS - Automatic Identification Systems) which are presently used in both sea and inland navigation require purchase and installation of relatively expensive transceivers...

Pełny tekst do pobrania w serwisie zewnętrznym

Luminescence recognition material as an INHIBIT logic gate in presence of Pb2+ and Cu2+ ions in aqueous solutions

Publikacja

M. Orłowska
A. Kłonkowski
J. Jezierska
J. Ryl

- SENSORS AND ACTUATORS B-CHEMICAL - Rok 2013

A recognition material consisting of silica xerogel with amino-modified surface selectively recognizes Pb2+ and Cu2+ (but only in presence of Pb2+ ions) in aqueous solutions of other metal ions. The analytical action of the material is based on a significant change in luminescence emission spectra of the material after chemisorption of Pb2+ ions. In the presence of Pb2+ in octahedral coordination environment, a new broad and strong...

Pełny tekst do pobrania w serwisie zewnętrznym

Speech formant frequency and pitch estimation using instantaneous complex frequency

Publikacja

M. [. Kaniewska

- Rok 2008

W pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.

Time-scale modification of speech signals for supporting hearing impaired schoolchildren

Publikacja

- Rok 2009

A study of time scale modification algorithmsapplied to hearing impaired schoolchildren supporting ispresented. Variety of algorithms are considered, namely:overlap and add, two variations of synchronized overlapand add, and the phase vocoder. Their effectiveness as wellas real-time processing capabilities are examined.

Recognition Dynamics of Cancer Mutations on the ERp57-Tapasin Interface

Publikacja

M. Padariya
U. Kalathiya
D. Houston
J. Alfaro

- Cancers - Rok 2020

Pełny tekst do pobrania w serwisie zewnętrznym

Gait Recognition: A Challenging Task for MEMS Signal Identification

Publikacja

S. Głowiński
A. Błażejewski
T. Królikowski
R. Knitter
S. Glowinski

- Rok 2019

Pełny tekst do pobrania w serwisie zewnętrznym

Buzz-based recognition of the honeybee colony circadian rhythm

Publikacja

T. Cejrowski
J. Szymański
D. Logofătu

- COMPUTERS AND ELECTRONICS IN AGRICULTURE - Rok 2020

Pełny tekst do pobrania w serwisie zewnętrznym

Recognition of input items to the logistic operations in accommodation services

Publikacja

- Logistyka - Rok 2014

In this study the authors set themselves the aim to analyze the elements of the entrance to the accommodation services in terms of logistics. Therefore, providers of this type of services were examined. This allowed to carry out analyses also with including the variety of accommodation services

Multidimensional Scaling Analysis Applied to Music Mood Recognition

Publikacja

- Rok 2013

The paper presents two experiments aimed at categorizing mood associated with music. Two parts of a listening test were designed and carried out with a group of students, most of whom where users of online social music services. The initial experiment was designed to evaluate the extent to which a given label describes the mood of the particular music excerpt. The second subjective test was conducted to collect the similarity data...

Mutual recognition of certification systems: The case of SERMO and ACLES

Publikacja

J. Zabala-Delgado
B. Sawicka

- Language Learning in Higher Education - Rok 2019

Pełny tekst do pobrania w serwisie zewnętrznym

Towards Recognition of Spatial Relations between Entities for Polish

Publikacja

M. Marcińczuk
M. Oleksy
J. Wieczorek

- Cognitive Studies | Études cognitives - Rok 2016

Pełny tekst do pobrania w serwisie zewnętrznym

Evaluation of Knowledge-Based Recognition of Spatial Expressions for Polish

Publikacja

M. Marcińczuk
M. Oleksy
J. Wieczorek

- Rok 2020

Pełny tekst do pobrania w serwisie zewnętrznym

Buzz-based recognition of the honeybee colony circadian rhythm

Publikacja

- COMPUTERS AND ELECTRONICS IN AGRICULTURE - Rok 2020

Honeybees are one of the highly valued pollinators. Their work as individuals is appreciated for crops pollination and honey production. It is believed that work of an entire bee colony is intense and almost continuous. The goal of the work presented in this paper is identification of bees circadian rhythm with a use of sound-based analysis. In our research as a source of information on bee colony we use their buzz that have been...

Pełny tekst do pobrania w portalu

Camera-based Automatic System for Tool Measurements and Recognition

Publikacja

T. Mikołajczyk
A. Kłodowski
A. Mrozinski
A. Mroziński

- Procedia Technology - Rok 2016

Pełny tekst do pobrania w serwisie zewnętrznym

Machine learning applied to bi-heterocyclic drugs recognition

Publikacja

M. Nowak
K. Nowak
M. Grzelczak
B. Szlachetko
L. Sterczewski
E. Plinski
P. Swiatek
M. Strzelecka
S. Plinska
W. Malinka

- Rok 2017

Pełny tekst do pobrania w serwisie zewnętrznym

A Framework for Training and Testing of Complex Pattern Recognition Systems

Publikacja

- Rok 2011

W pracy przedstawiono szkielet aplikacji stworzony po to, by uprościć konstruowanie systemów rozpoznawania obrazów oraz zapewnić środowisko testowe umożliwiające ocenę algorytmów przy użyciu dużych zestawów danych. Jasno zdefiniowana architektura wraz z wieloma gotowymi do użycia modułami pozwala skoncentrować się na implementacji najważniejszych algorytmów. Szkielet wspiera tworzenie modułów, który mogą być wielokrotnie używane,...

Automatic recognition of the arterial input function in MRI studies

Publikacja

- Rok 2005

Artykuł prezentuje opis automatycznej metody detekcji tętniczej funkcji wejście (AIF). Metoda została porównana z klinicznie pomierzonymi seriami obrazów DSC-MRI.

Versatile pattern recognition system based on Fisher criterion

Publikacja

- Rok 2003

Zaprezentowano system rozpoznawania obrazów w postaci bitmap. Zaimplementowany algorytm ekstrakcji cech jest uniwersalny i może być używany do różnych obrazów. Cały system bazuje na kryterium Fishera.

Recognition of hazardous acoustic events employing parallel processing on a supercomputing cluster . Rozpoznawanie niebezpiecznych zdarzeń dźwiękowych z wykorzystaniem równoległego przetwarzania na klastrze superkomputerowym

Publikacja

- Rok 2015

A method for automatic recognition of hazardous acoustic events operating on a super computing cluster is introduced. The methods employed for detecting and classifying the acoustic events are outlined. The evaluation of the recognition engine is provided: both on the training set and using real-life signals. The algorithms yield sufficient performance in practical conditions to be employed in security surveillance systems. The...

Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm

Publikacja

- International Journal of Intelligent Information and Database Systems - Rok 2008

W artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...

Pełny tekst do pobrania w serwisie zewnętrznym

Ontological Modeling for Contextual Data Describing Signals Obtained from Electrodermal Activity for Emotion Recognition and Analysis

Publikacja

- IEEE Access - Rok 2023

Most of the research in the field of emotion recognition is based on datasets that contain data obtained during affective computing experiments. However, each dataset is described by different metadata, stored in various structures and formats. This research can be counted among those whose aim is to provide a structural and semantic pattern for affective computing datasets, which is an important step to solve the problem of data...

Pełny tekst do pobrania w portalu

Poll Reader - the working prototype of optical mark recognition software

Publikacja

M. Smiatacz

- Rok 2007

Automatyczne rozpoznawanie zaznaczeń wydaje się stosunkowo prostym zadaniem z dziedziny przetwarzania dokumentów, a komercyjne systemy OMR są dostępne na rynku już od dłuższego czasu. Zdecydowaliśmy się jednak na stworzenie prostego darmowego oprogramowania, które mogłoby być wykorzystywane przez uczelnie zobowiązane do przeprowadzania ankiet wśród studentów. W rozdziale opisano konstrukcję programu oraz najważniejsze algorytmy...

Recognition of social health: A conceptual framework in the context of dementia research

Publikacja

M. Vernooij-Dassen
E. Verspoor
S. Samtani
P. Sachdev
M. Ikram
M. Vernooij
C. Hubers
R. Chattat
M. Lenart-Bugla
J. Rymaszewska... i 14 innych

- Frontiers in Psychiatry - Rok 2022

Pełny tekst do pobrania w serwisie zewnętrznym

Face recognition by humans with gaze-tracking system Cyber-Eye

Publikacja

- Rok 2010

W celu dokładniejszego zrozumienia sposobu rozpoznawania i zapamiętywania twarzy przez człowieka przeprowadzono doświadczenie na grupie 20 osób z wykorzystaniem wcześniej opracowanego systemu śledzenia fiksacji wzroku Cyber-Oko [3]. Wykorzystując diody i kamerę podczerwieni wraz z dedykowanym oprogramowaniem Cyber-Oko, które pozwala na śledzenie punktu skupienia wzroku na ekranie. Każdej osobie biorącej udział w doświadczeniu pokazano...

Blur recognition using second fundamental form of image surface

Publikacja

R. Kvyetnyy
Y. Bunyak
O. Sofina
A. Kotyra
R. Romaniuk
A. Tuleshova
R. S. Romaniuk

- Rok 2015

Pełny tekst do pobrania w serwisie zewnętrznym

Lip movement and gesture recognition for a multimodal human-computer interface

Publikacja

- Rok 2009

Pełny tekst do pobrania w serwisie zewnętrznym

Wyszukiwarka

Filtry

Katalog

Kategoria

Rok

Opcje

Wyniki wyszukiwania dla: audiovisual speech recognition