Search results for: przetwarzanie mowy
-
Biometria i przetwarzanie mowy 2023
e-Learning Courses{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
-
Biometria i przetwarzanie mowy 2024
e-Learning Courses{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
-
Biometria i przetwarzanie mowy 2025
e-Learning Courses -
Głębokie przetwarzanie tekstu i sygnału mowy 2022
e-Learning Courses -
Głębokie przetwarzanie tekstu i sygnału mowy 2023
e-Learning Courses -
Głębokie przetwarzanie tekstu i sygnału mowy 2024
e-Learning Courses -
Andrzej Czyżewski prof. dr hab. inż.
PeopleProf. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...
-
Bożena Kostek prof. dr hab. inż.
People -
New approach to localization of clicks in archive speech signals.
PublicationPrzedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.
-
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results
PublicationW artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...
-
Rejestracja i analiza kontekstu emocjonalnego człowieka w przetwarzaniu wszechobecnym
PublicationSystemy przetwarzania wszechobecnego tworzące inteligentneśrodowisko podejmują działania na podstawie zebranych informacji nazywanych kontekstem. Umiejętność rozpoznawania ludzkich emocji, jako przejaw wyższej inteligencji, jest ich pożądaną cechą. Istnieje kilka modeli doznań emocjonalnych, które mogą stać się podstawą do budowy uniwersalnego systemu rozpoznającego emocje, bazującego na ekstrakcji cech z danych wejściowych i klasyfkacji...
-
Zespolona pulsacja chwilowa w analizie i konwersji głosu
PublicationPrzedstawiona rozprawa doktorska dotyczy badania głosu z wykorzystaniem reprezentacji sygnału mowy za pomocą zespolonej pulsacji chwilowej (ICF od ang. Instantaneous Complex Frequency). Zespolona pulsacja chwilowa opiera się na koncepcji rzeczywistej częstotliwości chwilowej (IF od ang. Instantaneous Frequency), która estymuje częstotliwość sygnału w każdej chwili czasu jako pochodną jego fazy chwilowej. Główną zaletą takiego podejścia...
-
Przetwarzanie dźwięków i obrazów
e-Learning CoursesCyfrowy tor foniczny i wizyjny. Elementy grafiki komputerowej i jej przetwarzania. Zniekształcenia dźwięku i obrazu, ich przyczyny i podstawowe metody ograniczania. Przetwarzanie brzmienia i synteza dźwięku. Podstawowe metody przetwarzania obrazu wizyjnego. Kodowanie dźwięku w procesie zapisu. Filtracja cyfrowa i metody projektowania filtrów cyfrowych. Podstawowe metody przetwarzania obrazu wizyjnego. Specjalne metody przetwarzania...
-
Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych
PublicationWniniejszej pracy doktorskiej opisano nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone...
-
Inteligentne Systemy Interaktywne
Research TeamsNaturalne interfejsy, umożliwiające inteligentną interakcję człowiek-maszyna z możliwością oddziaływania na możliwie wszystkie zmysły człowieka równocześnie i bez potrzeby jego wcześniejszego szkolenia w zakresie używania typowych urządzeń zewnętrznych komputera, w tym z wykorzystaniem metod automatycznego rozpoznawania i syntezy mowy, biometrii, proaktywnych (samo-wykonywalnych) dokumentów elektronicznych, rozpoznawania emocji...
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublicationIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Intelligent processing of stuttered speech.
PublicationW artykule zaprezentowano kilka metod analizy i automatycznego zliczania potknięć artykulacyjnych, związanych z jąkaniem się, opartych na wykorzystaniu algorytmów uczących się sztucznych sieci neuronowych i zbiorów przybliżonych.
-
Human voice modification using instantaneous complex frequency
PublicationThe paper presents the possibilities of changing human voice by modifying instantaneous complex frequency (ICF) of the speech signal. The proposed method provides a flexible way of altering voice without the necessity of finding fundamental frequency and formants' positions or detecting voiced and unvoiced fragments of speech. The algorithm is simple and fast. Apart from ICF it uses signal factorization into two factors: one fully...
-
New Applications of Multimodal Human-Computer Interfaces
PublicationMultimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...
-
Voiceless Stop Consonant Modelling and Synthesis Framework Based on MISO Dynamic System
PublicationA voiceless stop consonant phoneme modelling and synthesis framework based on a phoneme modelling in low-frequency range and high-frequency range separately is proposed. The phoneme signal is decomposed into the sums of simpler basic components and described as the output of a linear multiple-input and single-output (MISO) system. The impulse response of each channel is a third order quasi-polynomial. Using this framework, the...