Wyniki wyszukiwania dla: ROZPOZNAWANIE MOWY - MOST Wiedzy

Wyszukiwarka

Wyniki wyszukiwania dla: ROZPOZNAWANIE MOWY

Filtry

wszystkich: 16
wybranych: 14

wyczyść wszystkie filtry


Filtry wybranego katalogu

  • Kategoria

  • Rok

  • Opcje

wyczyść Filtry wybranego katalogu niedostępne

Wyniki wyszukiwania dla: ROZPOZNAWANIE MOWY

  • Audiovisual speech recognition for training hearing impaired patients

    Publikacja

    Praca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...

  • Applications of knowledge technologies to sound and vision engineering

    Publikacja

    - Rok 2006

    Specjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...

  • System inteligentnej nawigacji sterowanej głosem

    W pracy rozważa się zagadnienie wykorzystania inteligentnego systemu nawigowania oraz przeglądania serwisu Internetowego z wykorzystaniem głosu. Projekt, na podstawie przeglądu zagadnień, scala istniejące rozwiązania, które umożliwiają sterowanie portalem internetowym za pomocą głosu w języku angielskim. Użytkownik otrzymuje możliwość wydawania komend głosowych, a także zapytań odnośnie zawartości portalu. W odróżnieniu od wielu...

  • Vowel recognition based on acoustic and visual features

    W artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...

    Pełny tekst do pobrania w portalu

  • Playback detection using machine learning with spectrogram features approach

    Publikacja

    This paper presents 2D image processing approach to playback detection in automatic speaker verification (ASV) systems using spectrograms as speech signal representation. Three feature extraction and classification methods: histograms of oriented gradients (HOG) with support vector machines (SVM), HAAR wavelets with AdaBoost classifier and deep convolutional neural networks (CNN) were compared on different data partitions in respect...

    Pełny tekst do pobrania w portalu

  • Uniwersalny system RPG do zastosowań w przestrzeniach inteligentnych

    Publikacja

    - Rok 2009

    Artykuł dotyczy systemów rozpoznawania poleceń głosowych(RPG). Przedstawiono dwa podstawowe rodzaje systemów RPG i przeprowadzono dyskusję nad wyborem architektury odpowiedniej do zastosowań w przestrzeniach inteligentnych (PI). Zaprezentowano algorytm czasowego dopasowania sygnałów (ang. Dinamic Time Warping - DTW) oraz budowę elementu decyzyjnego zaimplementowanego systemu. Przedstawiono wyniki oceny tego systemu.

  • System rozpoznawania mowy wykorzystujący cechy wizualne

    Publikacja

    - Rok 2005

    Niniejszy artykuł przedstawia metodę rozpoznawania głosek na podstawie analizy ruchu ust, która może znaleźć zastosowanie w terapii logopedycznej osób z wadami słuchu. W pracy opisano algorytm wyznaczana i śledzenia położenia ust oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. Dodatkowo przeprowadzono...

  • Language material for English audiovisual speech recognition system developmen . Materiał językowy do wykorzystania w systemie audiowizualnego rozpoznawania mowy angielskiej

    Publikacja

    - Rok 2013

    The bi-modal speech recognition system requires a 2-sample language input for training and for testing algorithms which precisely depicts natural English speech. For the purposes of the audio-visual recordings, a training data base of 264 sentences (1730 words without repetitions; 5685 sounds) has been created. The language sample reflects vowel and consonant frequencies in natural speech. The recording material reflects both the...

  • Combining visual and acoustic modalities to ease speech recognition by hearing impaired people

    Publikacja

    - Rok 2005

    Artykuł prezentuje system, którego celem działania jest ułatwienie procesu treningu poprawnej wymowy dla osób z poważnymi wadami słuchu. W analizie mowy wykorzystane zostały parametry akutyczne i wizualne. Do wyznaczenia parametrów wizualnych na podstawie kształtu i ruchu ust zostały wykorzystane modele Active Shape Models. Parametry akustyczne bazują na współczynnikach melcepstralnych. Do klasyfikacji wypowiadanych głosek została...

  • Speech recognition system for hearing impaired people.

    Publikacja

    - Rok 2005

    Praca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...

  • Wykorzystanie analizy obrazu w rozpoznawaniu mowy

    Publikacja

    - Rok 2005

    Niniejszy referat przedstawia metodę rozpoznawania mowy na podstawie analizy ruchu ust. W pracy opisano algorytm wyznaczana i śledzenia położenia ust wykorzystujący modele Active Shape Models oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. W pracy umieszczono wyniki klasyfikacji oraz wnioski.

  • Voice command recognition using hybrid genetic algorithm

    Publikacja

    Abstract: Speech recognition is a process of converting the acoustic signal into a set of words, whereas voice command recognition consists in the correct identification of voice commands, usually single words. Voice command recognition systems are widely used in the military, control systems, electronic devices, such as cellular phones, or by people with disabilities (e.g., for controlling a wheelchair or operating a computer...

    Pełny tekst do pobrania w portalu

  • Material for Automatic Phonetic Transcription of Speech Recorded in Various Conditions

    Publikacja

    Automatic speech recognition (ASR) is under constant development, especially in cases when speech is casually produced or it is acquired in various environment conditions, or in the presence of background noise. Phonetic transcription is an important step in the process of full speech recognition and is discussed in the presented work as the main focus in this process. ASR is widely implemented in mobile devices technology, but...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Różnica w subiektywnej ocenie jakości mowy pomiędzy nastolatkami dwujęzycznymi a jednojęzycznymi

    Publikacja

    - Rok 2021

    Proces percepcji mowy omawiany jest w szerokim zakresie dziedzin i dyscyplin naukowych, od nauk humanistycznych, technicznych, aż po nauki medyczne. Wiele badań skupia się np. na ocenie różnicy w grupach bez i z wykształceniem muzycznym. Skoro stwierdzono, że zdolności muzyczne wpływają na percepcję poszczególnych atrybutów dźwięku, autorzy postanowili zbadać, czy zdolności językowe także mogą mieć wpływ na ocenę jakości sygnału...

    Pełny tekst do pobrania w serwisie zewnętrznym