Wyniki wyszukiwania dla: audio-visual speech recognition

Wyniki wyszukiwania dla: audio-visual speech recognition

Filtry

wszystkich: 55

wyczyść wszystkie filtry niedostępne

Najlepsze wyniki w katalogu: Potencjał Badawczy Pokaż wszystkie wyniki (45)

Zespół Systemów Multimedialnych
Potencjał Badawczy
- Katedra Systemów Multimedialnych
* technologie archiwizacji, rekonstrukcji i dostępu do nagrań archiwalnych * technologie inteligentnego monitoringu wizyjnego i akustycznego * multimedialne technologie telemedyczne * multimodalne interfejsy komputerowe
Zespół Systemów Multimedialnych
Potencjał Badawczy
- Katedra Systemów Multimedialnych
* technologie archiwizacji, rekonstrukcji i dostępu do nagrań archiwalnych * technologie inteligentnego monitoringu wizyjnego i akustycznego * multimedialne technologie telemedyczne * multimodalne interfejsy komputerowe
Zespół Inżynierii Biomedycznej
Potencjał Badawczy
- Katedra Inżynierii Biomedycznej
Inżynieria biomedyczna stanowi nową interdyscyplinarną dziedzinę wiedzy zlokalizowaną na pograniczu nauk technicznych, medycznych i biologicznych. Według opinii WHO (World Health Organization) można ją zaliczyć do głównych (obok inżynierii genetycznej) czynników decydujących o postępie współczesnej medycyny. Rosnące znaczenie kształcenia w zakresie INŻYNIERII BIOMEDYCZNEJ wynika z faktu, że specjaliści tej dyscypliny są potrzebni...

Najlepsze wyniki w katalogu: Oferta Biznesowa Pokaż wszystkie wyniki (10)

Brain and Mind Electrophysiology lab

Oferta Biznesowa
Katedra Systemów Multimedialnych

Neurofizjologia pamięci i funkcji poznawczych mózgu
Laboratorium Badawcze 2-3

Oferta Biznesowa
Katedra Elektrotechniki, Systemów Sterowania i Informatyki

Obliczenia komputerowe wymagające dużych mocy obliczeniowych z wykorzystaniem oprogramowania typu: Matlab, Tomlab, Gams, Apros.
Laboratorium Badań Środowiskowych w Transporcie

Oferta Biznesowa

Badania sygnałów akustycznych i drganiowych. Analizy sygnałów wibroakustycznych.

Pozostałe wyniki Pokaż wszystkie wyniki (331)

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY
Publikacja
- Rok 2014
The problem of video framerate and audio/video synchronization in audio-visual speech recognition is considered. The visual features are added to the acoustic parameters in order to improve the accuracy of speech recognition in noisy conditions. The Mel-Frequency Cepstral Coefficients are used on the acoustic side whereas Active Appearance Model features are extracted from the image. The feature fusion approach is employed. The...
EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY
Publikacja
- Rok 2014
The problem of video framerate and audio/video synchronization in audio-visual speech recogni-tion is considered. The visual features are added to the acoustic parameters in order to improve the accuracy of speech recognition in noisy conditions. The Mel-Frequency Cepstral Coefficients are used on the acoustic side whereas Active Appearance Model features are extracted from the image. The feature fusion approach is employed. The...
An audio-visual corpus for multimodal automatic speech recognition
Publikacja
- JOURNAL OF INTELLIGENT INFORMATION SYSTEMS - Rok 2017
review of available audio-visual speech corpora and a description of a new multimodal corpus of English speech recordings is provided. The new corpus containing 31 hours of recordings was created specifically to assist audio-visual speech recognition systems (AVSR) development. The database related to the corpus includes high-resolution, high-framerate stereoscopic video streams from RGB cameras, depth imaging stream utilizing Time-of-Flight...

Pełny tekst do pobrania w portalu
Multimodal Audio-Visual Recognition of Traffic Events
Publikacja
- Rok 2011
Przedstawiono demonstrator systemu wykrywania niebezpiecznych zdarzeń w ruchu drogowym oparty na jednoczesnej analizie danych wizyjnych i akustycznych. System jest częścią systemu automatycznego nadzoru bezpieczeństwa. Wykorzystuje on kamery i mikrofony jako źródła danych. Przedstawiono wykorzystane algorytmy - algorytmy rozpoznawania zdarzeń dźwiękowych oraz analizy obrazu. Zaprezentowano wyniki działania algorytmów na przykładzie...
Visual Lip Contour Detection for the Purpose of Speech Recognition
Publikacja
- Rok 2014
A method for visual detection of lip contours in frontal recordings of speakers is described and evaluated. The purpose of the method is to facilitate speech recognition with visual features extracted from a mouth region. Different Active Appearance Models are employed for finding lips in video frames and for lip shape and texture statistical description. Search initialization procedure is proposed and error measure values are...

Wyszukiwarka

Filtry

Katalog

Najlepsze wyniki w katalogu: Potencjał Badawczy Pokaż wszystkie wyniki (45)

Wyniki wyszukiwania dla: audio-visual speech recognition

Najlepsze wyniki w katalogu: Oferta Biznesowa Pokaż wszystkie wyniki (10)

Wyniki wyszukiwania dla: audio-visual speech recognition

Pozostałe wyniki Pokaż wszystkie wyniki (331)

Wyniki wyszukiwania dla: audio-visual speech recognition