A comparative study of English viseme recognition methods and algorithms

Dawid Jachimski; Andrzej Czyżewski; Tomasz Ciszewski

doi:10.1007/s11042-017-5217-5

A comparative study of English viseme recognition methods and algorithms

Abstrakt

An elementary visual unit – the viseme is concerned in the paper in the context of preparing the feature vector as a main visual input component of Audio-Visual Speech Recognition systems. The aim of the presented research is a review of various approaches to the problem, the implementation of algorithms proposed in the literature and a comparative research on their effectiveness. In the course of the study an optimal feature vector construction and an appropriate selection of the classifier were sought. The experimental research was conducted on the basis of a spoken corpus in which speech was represented both acoustically and visually. The extracted features represented three types: geometrical, textural and mixed ones. The features were processed employing the classification algorithms based on Hidden Markov Models and Sequential Minimal Optimization. Tests were carried out employing the processed video material recorded with English native speakers who read specially prepared list of commands. The obtained results are discussed in the paper.

Cytowania

1 3

CrossRef
0

Web of Science
1 2

Scopus

Autorzy (3)

Cytuj jako

Pełna treść

pobierz publikację

pobrano 39 razy

Wersja publikacji: Accepted albo Published Version
DOI:: Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1007/s11042-017-5217-5
Licencja: otwiera się w nowej karcie

pełna treść artykułu zobacz w serwisie zewnętrznym otwiera się w nowej karcie

Słowa kluczowe

VISEME · PARAMETERIZATION OF MOUTH REGION · SUPPORT VECTOR MACHINE · HIDDEN MARKOV MODEL · PATTERN RECOGNITION · AUDIOVISUAL SPEECH RECOGNITION

Informacje szczegółowe

Kategoria:: Publikacja w czasopiśmie
Typ:: artykuł w czasopiśmie wyróżnionym w JCR
Opublikowano w:: MULTIMEDIA TOOLS AND APPLICATIONS nr 77, strony 16495 - 16532,
ISSN: 1380-7501
Język:: angielski
Rok wydania:: 2018
Opis bibliograficzny:: JACHIMSKI D., Czyżewski A., Ciszewski T.: A comparative study of English viseme recognition methods and algorithms// MULTIMEDIA TOOLS AND APPLICATIONS. -Vol. 77, iss. 13 (2018), s.16495-16532
DOI:: Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1007/s11042-017-5217-5
Weryfikacja:: Politechnika Gdańska

Powiązane datasety

dane badawcze MODALITY corpus - SPEAKER 17 - SEQUENCE S1
dane badawcze MODALITY corpus - SPEAKER 39 - SEQUENCE S1
dane badawcze MODALITY corpus - SPEAKER 39 - COMMANDS C1
dane badawcze MODALITY corpus - SPEAKER 33 - COMMANDS C1
dane badawcze MODALITY corpus - SPEAKER 17 - COMMANDS C1
dane badawcze MODALITY corpus - SPEAKER 33 - SEQUENCE S1
dane badawcze MODALITY corpus - SPEAKER 05 - SEQUENCE S1
dane badawcze MODALITY corpus - SPEAKER 01 - COMMANDS C1
dane badawcze MODALITY corpus - SPEAKER 01 - SEQUENCE S1
dane badawcze MODALITY corpus - SPEAKER 23 - SEQUENCE S1

zobacz wszystkie (159)

wyświetlono 225 razy

A comparative study of English viseme recognition methods and algorithms

Abstrakt

Cytowania

Autorzy (3)

Dawid Jachimski

Andrzej Czyżewski prof. dr hab. inż.

Tomasz Ciszewski dr hab.

Cytuj jako

Pełna treść

Słowa kluczowe

Informacje szczegółowe

Powiązane datasety

Publikacje, które mogą cię zainteresować

A comparative study of English viseme recognition methods and algorithm

Examining Influence of Distance to Microphone on Accuracy of Speech Recognition

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY

Wyszukiwarka

A comparative study of English viseme recognition methods and algorithms

Abstrakt

Cytowania

Autorzy (3)

Dawid Jachimski

Andrzej Czyżewski prof. dr hab. inż.

Tomasz Ciszewski dr hab.

Cytuj jako

Pełna treść

Słowa kluczowe

Informacje szczegółowe

Powiązane datasety

Publikacje, które mogą cię zainteresować

A comparative study of English viseme recognition methods and algorithm

Examining Influence of Distance to Microphone on Accuracy of Speech Recognition

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY