Abstrakt
convolutional neural network (CNN) which is a class of deep, feed-forward artificial neural network. We decided to analyze audio signal feature maps, namely spectrograms, linear and Mel-scale cepstrograms, and chromagrams. The choice was made upon the fact that CNN performs well in 2D data-oriented processing contexts. Feature maps were employed in the Lithuanian word recognition task. The spectral analysis led to the highest word recognition rate. Spectral and mel-scale cepstral feature spaces outperform linear cepstra and chroma. The 111-word classification experiment depicts f1 score of 0.99 for spectrum, 0.91 for mel-scale cepstrum , 0.76 for chromagram, and 0.64 for cepstrum feature space on test data set.
Cytowania
-
2 7
CrossRef
-
0
Web of Science
-
4 0
Scopus
Autorzy (5)
Cytuj jako
Pełna treść
pełna treść publikacji nie jest dostępna w portalu
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Publikacja w czasopiśmie
- Typ:
- artykuł w czasopiśmie wyróżnionym w JCR
- Opublikowano w:
-
JOURNAL OF THE AUDIO ENGINEERING SOCIETY
nr 66,
strony 1072 - 1081,
ISSN: 1549-4950 - Język:
- angielski
- Rok wydania:
- 2018
- Opis bibliograficzny:
- Korvel G., Treigys P., Tamulevicus G., Bernataviciene J., Kostek B.: Analysis of 2D Feature Spaces for Deep Learning-based Speech Recognition// JOURNAL OF THE AUDIO ENGINEERING SOCIETY. -Vol. 66, nr. 12 (2018), s.1072-1081
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.17743/jaes.2018.0066
- Źródła finansowania:
-
- Działalność statutowa/subwencja
- Projekt Metodyka i technologia polimodalnej alofonicznej transkrypcji mowy
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 246 razy
Publikacje, które mogą cię zainteresować
Investigating Feature Spaces for Isolated Word Recognition
- G. Korvel,
- G. Tamulevicus,
- P. Treigys
- + 2 autorów
Investigating Feature Spaces for Isolated Word Recognition
- P. Treigys,
- G. Korvel,
- G. Tamulevicius
- + 2 autorów