Wyniki wyszukiwania dla: przetwarzanie mowy

Wyniki wyszukiwania dla: przetwarzanie mowy

wyników na stronę:
osadź ten widok na swojej stronie

Filtry

wszystkich: 20

wyczyść wszystkie filtry niedostępne

Biometria i przetwarzanie mowy 2023
Kursy Online
- J. Daciuk
{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
Biometria i przetwarzanie mowy 2024
Kursy Online
- J. Daciuk
{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
Biometria i przetwarzanie mowy 2025
Kursy Online
- J. Daciuk
Głębokie przetwarzanie tekstu i sygnału mowy 2022
Kursy Online
- S. Cygert
- S. Zaporowski
- P. Szczuko
Głębokie przetwarzanie tekstu i sygnału mowy 2023
Kursy Online
- S. Cygert
- S. Zaporowski
- P. Szczuko
- A. Harasimiuk
Głębokie przetwarzanie tekstu i sygnału mowy 2024
Kursy Online
- A. Kurowski
- S. Cygert
- S. Zaporowski
- P. Szczuko
- A. Harasimiuk
Andrzej Czyżewski prof. dr hab. inż.

Osoby

Katedra Systemów Multimedialnych

Prof. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...
Bożena Kostek prof. dr hab. inż.

Osoby

Laboratorium Akustyki Fonicznej
New approach to localization of clicks in archive speech signals.
Publikacja
- M. Niedźwiecki
- A. Sobociński
- Rok 2004
Przedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results
Publikacja
- Z. Wojan
- W. Lis
- K. Wojan
- Rok 2005
W artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...
Rejestracja i analiza kontekstu emocjonalnego człowieka w przetwarzaniu wszechobecnym
Publikacja
- A. Bońkowski
- Rok 2009
Systemy przetwarzania wszechobecnego tworzące inteligentneśrodowisko podejmują działania na podstawie zebranych informacji nazywanych kontekstem. Umiejętność rozpoznawania ludzkich emocji, jako przejaw wyższej inteligencji, jest ich pożądaną cechą. Istnieje kilka modeli doznań emocjonalnych, które mogą stać się podstawą do budowy uniwersalnego systemu rozpoznającego emocje, bazującego na ekstrakcji cech z danych wejściowych i klasyfkacji...
Zespolona pulsacja chwilowa w analizie i konwersji głosu
Publikacja
- M. Kaniewska
- Rok 2012
Przedstawiona rozprawa doktorska dotyczy badania głosu z wykorzystaniem reprezentacji sygnału mowy za pomocą zespolonej pulsacji chwilowej (ICF od ang. Instantaneous Complex Frequency). Zespolona pulsacja chwilowa opiera się na koncepcji rzeczywistej częstotliwości chwilowej (IF od ang. Instantaneous Frequency), która estymuje częstotliwość sygnału w każdej chwili czasu jako pochodną jego fazy chwilowej. Główną zaletą takiego podejścia...
Przetwarzanie dźwięków i obrazów
Kursy Online
- P. Odya
- J. Kotus
- S. Cygert
- B. Kostek
- G. Szwoch
- A. Czyżewski
- M. Szczodrak
Cyfrowy tor foniczny i wizyjny. Elementy grafiki komputerowej i jej przetwarzania. Zniekształcenia dźwięku i obrazu, ich przyczyny i podstawowe metody ograniczania. Przetwarzanie brzmienia i synteza dźwięku. Podstawowe metody przetwarzania obrazu wizyjnego. Kodowanie dźwięku w procesie zapisu. Filtracja cyfrowa i metody projektowania filtrów cyfrowych. Podstawowe metody przetwarzania obrazu wizyjnego. Specjalne metody przetwarzania...
Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych
Publikacja
- M. Ciołek
- Rok 2017
Wniniejszej pracy doktorskiej opisano nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone...

Pełny tekst do pobrania w portalu
Inteligentne Systemy Interaktywne
Zespoły Badawcze
- Katedra Inteligentnych Systemów Interaktywnych
Naturalne interfejsy, umożliwiające inteligentną interakcję człowiek-maszyna z możliwością oddziaływania na możliwie wszystkie zmysły człowieka równocześnie i bez potrzeby jego wcześniejszego szkolenia w zakresie używania typowych urządzeń zewnętrznych komputera, w tym z wykorzystaniem metod automatycznego rozpoznawania i syntezy mowy, biometrii, proaktywnych (samo-wykonywalnych) dokumentów elektronicznych, rozpoznawania emocji...
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
Publikacja
- T. Bandurski
- Ł. Hamerski
- M. Papaj
- A. Paruzel
- K. Świder
- Rok 2007
In this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
Human voice modification using instantaneous complex frequency
Publikacja
- M. Kaniewska
- Rok 2010
The paper presents the possibilities of changing human voice by modifying instantaneous complex frequency (ICF) of the speech signal. The proposed method provides a flexible way of altering voice without the necessity of finding fundamental frequency and formants' positions or detecting voiced and unvoiced fragments of speech. The algorithm is simple and fast. Apart from ICF it uses signal factorization into two factors: one fully...
Intelligent processing of stuttered speech.
Publikacja
- A. Czyżewski
- A. Kaczmarek
- JOURNAL OF INTELLIGENT INFORMATION SYSTEMS - Rok 2003
W artykule zaprezentowano kilka metod analizy i automatycznego zliczania potknięć artykulacyjnych, związanych z jąkaniem się, opartych na wykorzystaniu algorytmów uczących się sztucznych sieci neuronowych i zbiorów przybliżonych.
New Applications of Multimodal Human-Computer Interfaces
Publikacja
- A. Czyżewski
- Rok 2012
Multimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...
Voiceless Stop Consonant Modelling and Synthesis Framework Based on MISO Dynamic System
Publikacja
- G. Korvel
- B. Kostek
- Archives of Acoustics - Rok 2017
A voiceless stop consonant phoneme modelling and synthesis framework based on a phoneme modelling in low-frequency range and high-frequency range separately is proposed. The phoneme signal is decomposed into the sums of simpler basic components and described as the output of a linear multiple-input and single-output (MISO) system. The impulse response of each channel is a third order quasi-polynomial. Using this framework, the...

Pełny tekst do pobrania w portalu

Wyszukiwarka

Filtry

Katalog

Wyniki wyszukiwania dla: przetwarzanie mowy

Andrzej Czyżewski prof. dr hab. inż.

Bożena Kostek prof. dr hab. inż.