A comparative study of English viseme recognition methods and algorithms

Dawid Jachimski; Andrzej Czyżewski; Tomasz Ciszewski

doi:10.1007/s11042-017-5217-5

A comparative study of English viseme recognition methods and algorithms

Abstrakt

An elementary visual unit – the viseme is concerned in the paper in the context of preparing the feature vector as a main visual input component of Audio-Visual Speech Recognition systems. The aim of the presented research is a review of various approaches to the problem, the implementation of algorithms proposed in the literature and a comparative research on their effectiveness. In the course of the study an optimal feature vector construction and an appropriate selection of the classifier were sought. The experimental research was conducted on the basis of a spoken corpus in which speech was represented both acoustically and visually. The extracted features represented three types: geometrical, textural and mixed ones. The features were processed employing the classification algorithms based on Hidden Markov Models and Sequential Minimal Optimization. Tests were carried out employing the processed video material recorded with English native speakers who read specially prepared list of commands. The obtained results are discussed in the paper.

Cytowania

1 5

CrossRef
0

Web of Science
1 3

Scopus

Autorzy (3)

Cytuj jako

Pełna treść

pobierz publikację

pobrano 32 razy

Wersja publikacji: Accepted albo Published Version
DOI:: Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1007/s11042-017-5217-5
Licencja: otwiera się w nowej karcie

pełna treść artykułu zobacz w serwisie zewnętrznym otwiera się w nowej karcie

Słowa kluczowe

VISEME · PARAMETERIZATION OF MOUTH REGION · SUPPORT VECTOR MACHINE · HIDDEN MARKOV MODEL · PATTERN RECOGNITION · AUDIOVISUAL SPEECH RECOGNITION

Informacje szczegółowe

Kategoria:: Publikacja w czasopiśmie
Typ:: artykuł w czasopiśmie wyróżnionym w JCR
Opublikowano w:: MULTIMEDIA TOOLS AND APPLICATIONS nr 77, strony 16495 - 16532,
ISSN: 1380-7501
Język:: angielski
Rok wydania:: 2018
Opis bibliograficzny:: JACHIMSKI D., Czyżewski A., Ciszewski T.: A comparative study of English viseme recognition methods and algorithms// MULTIMEDIA TOOLS AND APPLICATIONS. -Vol. 77, iss. 13 (2018), s.16495-16532
DOI:: Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1007/s11042-017-5217-5
Weryfikacja:: Politechnika Gdańska

Powiązane datasety

dane badawcze MODALITY corpus - SPEAKER 01 - COMMANDS C5
dane badawcze MODALITY corpus - SPEAKER 01 - COMMANDS C6
dane badawcze MODALITY corpus - SPEAKER 01 - SEQUENCE S4
dane badawcze MODALITY corpus - SPEAKER 01 - SEQUENCE S6
dane badawcze MODALITY corpus - SPEAKER 01 - COMMANDS C4
dane badawcze MODALITY corpus - SPEAKER 01 - SEQUENCE S2
dane badawcze MODALITY corpus - SPEAKER 01 - SEQUENCE S3
dane badawcze MODALITY corpus - SPEAKER 01 - COMMANDS C3
dane badawcze MODALITY corpus - SPEAKER 01 - COMMANDS C2
dane badawcze MODALITY corpus - SPEAKER 01 - SEQUENCE S5

zobacz wszystkie (159)

wyświetlono 218 razy

A comparative study of English viseme recognition methods and algorithms

Abstrakt

Cytowania

Autorzy (3)

Dawid Jachimski

Andrzej Czyżewski prof. dr hab. inż.

Tomasz Ciszewski dr hab.

Cytuj jako

Pełna treść

Słowa kluczowe

Informacje szczegółowe

Powiązane datasety

Publikacje, które mogą cię zainteresować

A comparative study of English viseme recognition methods and algorithm

Examining Influence of Distance to Microphone on Accuracy of Speech Recognition

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY

Wyszukiwarka

A comparative study of English viseme recognition methods and algorithms

Abstrakt

Cytowania

Autorzy (3)

Dawid Jachimski

Andrzej Czyżewski prof. dr hab. inż.

Tomasz Ciszewski dr hab.

Cytuj jako

Pełna treść

Słowa kluczowe

Informacje szczegółowe

Powiązane datasety

Publikacje, które mogą cię zainteresować

A comparative study of English viseme recognition methods and algorithm

Examining Influence of Distance to Microphone on Accuracy of Speech Recognition

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY

EXAMINING INFLUENCE OF VIDEO FRAMERATE AND AUDIO/VIDEO SYNCHRONIZATION ON AUDIO-VISUAL SPEECH RECOGNITION ACCURACY