Abstrakt
The study addresses the issues related to the appropriateness of a two-dimensional representation of speech signal for speech recognition tasks based on deep learning techniques. The approach combines Convolutional Neural Networks (CNNs) and time-frequency signal representation converted to the investigated feature spaces. In particular, waveforms and fractal dimension features of the signal were chosen for the time domain, and three feature spaces were investigated for the frequency domain, namely: Linear Prediction Coefficient (LPC) spectrum, Hartley spectrum, and cochleagram. Due to the fact that deep learning requires an adequate training set size of the corpus and its content may significantly influence the outcome, thus for the data augmentation purpose, the created dataset was extended with mixes of the speech signal with noise with various SNRs (Signal-to-Noise Ratio). In order to evaluate the applicability of the implemented feature spaces for isolated word recognition task, three experiments were conducted, i.e., 10-, 70-, and 111-word cases were analyzed.
Cytowania
-
5
CrossRef
-
0
Web of Science
-
0
Scopus
Autorzy (5)
Cytuj jako
Pełna treść
pełna treść publikacji nie jest dostępna w portalu
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Publikacja monograficzna
- Typ:
- rozdział, artykuł w książce - dziele zbiorowym /podręczniku w języku o zasięgu międzynarodowym
- Język:
- angielski
- Rok wydania:
- 2020
- Opis bibliograficzny:
- Treigys P., Korvel G., Tamulevicius G., Bernataviciene J., Kostek B.: Investigating Feature Spaces for Isolated Word Recognition// Data Science: New Issues, Challenges and Applications/ : , 2020, s.165-181
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1007/978-3-030-39250-5
- Źródła finansowania:
-
- Działalność statutowa/subwencja
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 131 razy
Publikacje, które mogą cię zainteresować
Investigating Feature Spaces for Isolated Word Recognition
- G. Korvel,
- G. Tamulevicus,
- P. Treigys
- + 2 autorów
A Study of Cross-Linguistic Speech Emotion Recognition Based on 2D Feature Spaces
- G. Tamulevicius,
- G. Korvel,
- A. B. Yayak
- + 3 autorów