Filtry
wszystkich: 237
-
Katalog
Wyniki wyszukiwania dla: transmisja sygnalow mowy
-
Audiovisual speech recognition for training hearing impaired patients
PublikacjaPraca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...
-
Szybka transmisja danych w systemie UMTS z wykorzystaniem turbokodu o zmniejszonej liczbie stanów
PublikacjaW referacie została przedstawiona budowa kodera i dekodera turbokodu o zmniejszonej liczbie stanów. Oba kodery splotowe wchodzące w skład tego turbokodera są 4-stanowe, czyli liczba stanów jest dwukrotnie mniejsza niż w standardowo stosowanym w systemie UMTS turbokoderze. Badania symulacyjne zostały przeprowadzone dla szybkości transmisji 384 kb/s w środowisku propagacyjnym miejskim, wokołobudynkowym i szybkości poruszania się...
-
Szybka transmisja danych w systemie UMTS z wykorzystaniem turbokodu o zmniejszonej liczbie stanów
PublikacjaW referacie została przedstawiona budowa kodera i dekodera turbokodu o zmniejszonej liczbie stanów. Oba kodery splotowe wchodzące w skład tego turbokodera są 4-stanowe, czyli liczba stanów jest dwukrotnie mniejsza niż w standardowo stosowanym w systemie UMTS turbokoderze. Badania symulacyjne zostały przeprowadzone dla szybkości transmisji 384 kb/s w środowisku propagacyjnym miejskim, wokołobudynkowym i szybkości poruszania się...
-
Improving signal quality in speech codec using hybrid perceptual-parametric algorithm. [Poprawa jakości sygnału w kodekach mowy przy użyciu hybrydowego, parametryczno-perceptualnego algorytmu kodowania]
PublikacjaPrzedstawiono hybrydową, parametryczno-perceptualną architekturę kodeka. Podstawowa struktura kodeka parametrycznego CELP została wzbogacona o kodowanie perceptualne. Celem hybrydyzacji kodeka jest uzyskanie znaczącej poprawy subiektywnej jakości zdekodowanego sygnału. Zaproponowano dwie hybrydowe struktury. Pierwsza polega na perceptualnym kodowaniu dźwięcznych elementów sygnału rezydualnego kodeka CELP. Druga metoda dzieli sygnał...
-
Subiektywny pomiar jakości sygnałów mowy i muzyki w lokalnych multipleksach radiofonii DAB+ w Gdańsku i Wrocławiu
PublikacjaRadiofonia cyfrowa DAB+ (Digital Audio Broadcasting plus) dostępna jest dla słuchaczy w Polsce od 2013 r. Standard ten oferuje szerokie możliwości konfiguracji multipleksów lokalnych nie tylko pod względem liczby, lecz także jakości nadawanych programów radiowych. Dzięki temu możliwe jest dostosowanie parametrów emitowanych sygnałów w celu sprostania oczekiwaniom odbiorców końcowych. W przeciwieństwie do radiofonii analogowej FM...
-
Piotr Odya dr inż.
OsobyPiotr Odya urodził się w Gdańsku w 1974. W 1999 roku ukończył z wyróżnieniem studia na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej zdobywając tytuł magistra inżyniera. Praca dyplomowa dotyczyła problemów poprawy jakości dźwięku w studiach emisyjnych współczesnych rozgłośni radiowych.Jego zainteresowania dotyczą montażu wideofonicznego, systemów dźwięku wielokanałowego. W ramach studiów doktoranckich...
-
Głębokie przetwarzanie tekstu i sygnału mowy 2022
Kursy Online -
Głębokie przetwarzanie tekstu i sygnału mowy 2023
Kursy Online -
Głębokie przetwarzanie tekstu i sygnału mowy 2024
Kursy Online -
Wartościowanie i ironia w tekście w świetle teorii aktów mowy
Publikacja -
Badanie właściwości sygnału telegraficznego oraz sygnału mowy przesyłanych przez kanał analogowy
PublikacjaW pracy zaprezentowano oprogramowanie TELESOUND, które powstało na potrzeby ćwiczenia pt. "Właściwości źródeł informacji" realizowanego w ramach laboratorium "Podstaw telekomunikacji". W trakcie tego ćwiczenia studenci zapoznają się z podstawowymi pojęciami i mechanizmami funkcjonowania systemów telekomunikacyjnych przekazujących wiadomości na odległość poprzez kanał przestrzenny. Na przykładzie telegrafii i telefonii, studenci...
-
Akustyczny obraz słowa na tle mowy etnicznej [The acoustic image of ethnic speech words]
Publikacja -
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
PublikacjaThis paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
-
Badanie rozkładów parametrów sygnału mowy w zastosowaniach do prognozowania prawdopodobieństwa popełnienia błędów w systemach identyfikacji mówców = Examining distribution of speech signal parameters for the prognosis of error probability in speaker verification systems
PublikacjaPrzedmiotem pracy jest system identyfikacji mówców w sposób zależny od tekstu ("text dependent''). Dokonano analizy wielu różnych wypowiedzi kilkudziesięciu mówców. Zastosowana metoda parametryzacji to metoda oparta na wynikach analizy cepstralnej sygnału mowy. Zdefiniowane zostały nowe parametry skojarzone z elementarnymi zdarzeniami w procesie weryfikacji mówców. Na tej podstawie dokonano estymacji funkcji gęstości prawdopodobieństwa...
-
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
PublikacjaW pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.
-
A low complexity double-talk detector based on the signal envelope
PublikacjaA new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...
-
Andrzej Czyżewski prof. dr hab. inż.
OsobyProf. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...
-
Cyfrowa analiza mowy etnicznej – ekstrakcja kodu informacji [A digital analysis of ethnic speech – deciphering the information code]
Publikacja -
Metodyka i system dopasowanie protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie.
Publikacja.
-
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych [A system of speech signal processing and visualisation for linguistic purposes]
Publikacja -
Transient detection for speech coding applications
PublikacjaSignal quality in speech codecs may be improved by selecting transients from speech signal and encoding them using a suitable method. This paper presents an algorithm for transient detection in speech signal. This algorithm operates in several frequency bands. Transient detection functions are calculated from energy measured in short frames of the signal. The final selection of transient frames is based on results of detection...
-
Language material for English audiovisual speech recognition system developmen . Materiał językowy do wykorzystania w systemie audiowizualnego rozpoznawania mowy angielskiej
PublikacjaThe bi-modal speech recognition system requires a 2-sample language input for training and for testing algorithms which precisely depicts natural English speech. For the purposes of the audio-visual recordings, a training data base of 264 sentences (1730 words without repetitions; 5685 sounds) has been created. The language sample reflects vowel and consonant frequencies in natural speech. The recording material reflects both the...
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublikacjaIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublikacjaIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
High quality speech codec employing sines+noise+transients model
PublikacjaA method of high quality wideband speech signal representation employing sines+transients+noise model is presented. The need for a wideband speech coding approach as well as various methods for analysis and synthesis of sines, residual and transient states of speech signal is discussed. The perceptual criterion is applied in the proposed approach during encoding of sines amplitudes in order to reduce bandwidth requirements and...
-
Jan Daciuk dr hab. inż.
OsobyJan Daciuk uzyskał tytuł zawodowy magistra na Wydziale Elektroniki Politechniki Gdańskiej w 1986 roku, a doktorat na wydziale Elektroniki, Telekomunikacji i Informatyki PG w 1999. Pracuje na Wydziale od 1988 roku. Jego zainteresowania naukowe obejmują zastosowania automatów skończonych w przetwarzaniu języka naturalnego i przetwarzaniu mowy. Spędził ponad cztery lata w europejskich uniwersytetach i instytutach naukowych, takich...
-
Speech codec enhancements utilizing time compression and perceptual coding
PublikacjaA method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband...
-
Dariusz Świsulski dr hab. inż.
Osoby -
Krzysztof Nyka dr hab. inż.
OsobyKrzysztof Nyka, absolwent Wydziału Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej (WETI PG), gdzie uzyskał tytuł magistra inżyniera (1986, telekomunikacja) stopień doktora nauk technicznych (2002, elektronika) i doktora habilitowanego (2020 automatyka, elektronika i elektrotechnika). Obecnie jest zatrudniony na stanowisku profesora uczelni w Katedrze Inżynierii Mikrofalowej i Antenowej WETI PG. Zainteresowania...
-
Sylwester Kaczmarek dr hab. inż.
OsobySylwester Kaczmarek ukończył studia w 1972 roku jako mgr inż. Elektroniki, a doktorat i habilitację uzyskał z technik komutacyjnych i inżynierii ruchu telekomunikacyjnego w 1981 i 1994 roku na Politechnice Gdańskiej. Jego zainteresowania badawcze ukierunkowane są na: sieci IP QoS, sieci GMPLS, sieci SDN, komutację, ruting QoS, inżynierię ruchu telekomunikacyjnego, usługi multimedialne i jakość usług. Aktualnie jego badania skupiają...
-
Multitask Noisy Speech Enhancement System
PublikacjaW referacie opisano Wielozadaniowy System Poprawy Jakości Sygnału Mowy. Jest to wyspecjalizowany pakiet oprogramowania przeznaczony do rejestrowania sygnału mowy i do poprawy jego jakości oraz zrozumiałości mowy, przy użyciu zaawansowanych procedur cyfrowego przetwarzania sygnału. Pakiet oprogramowania składa się z programów: Rejestrator, Przeglądarka oraz Rekonstruktor. Oprogramowanie to może być użyte w przypadkach, gdy zrozumiałość...
-
New generation speech aid for stuttering people
PublikacjaWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
New generation speech aid for stuttering people
PublikacjaWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language
PublikacjaPrzedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...
-
A system for multitask noisy speech enhancement.
PublikacjaW artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy...
-
Special hearing aid for stuttering people
PublikacjaDzięku postępowi w dziedzienie cyfrowego przetwarzania sygnałów możliwe stało zbudowanie subminiaturowego urządzenia łączącego funkcje aparatu słuchowego i korektora mowy. Takie urządzenie, mimo niewielkich rozmiarów, jest w stanie wykonywać skomplikowane alggorytmy a jego oprogramowanie może być łatwo zmieniane. W pracy skupiono się na zagadnieniach związanych z opracowniem prototypu i implementacją algorytmów korekcji słuchu...
-
Application of hybrid signals processors to speech and hearing aids
PublikacjaDzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...
-
New digital aids for pateints after laryngectomy
PublikacjaPowrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej...
-
Korekta akustyczna sali audytoryjnej Politechniki Śląskiej w Rybniku.
PublikacjaOmówiono korektę akustyczną sali audytoryjnej Politechniki Śląskiej w Rybniku. Przyczyną dokonania korekty była mała zrozumiałość mowy a powodowana nadmierną pogłosowością sali. Rozpatrzono wpływ rezonansu galerii na akustykę sali. Mimo ograniczonej ingerencji w architekturę sali związanej z zabytkowym charakterem budynku, korekta akustyczna znacząco poprawiła zrozumiałość mowy w sali.
-
Bartosz Czaplewski dr inż.
Osoby -
Moje refleksje po ukończeniu 75 lat.
PublikacjaSzkic stanowi streszczenie mowy, jaką wygłosił autor na uroczystości swego 75-lecia.
-
Online pitch estimation using instantaneous complex frequency
PublikacjaW pracy opisano nowe wyniki dotyczące skuteczności algorytmu potokowego estymującego częstotliwość podstawową sygnału mowy. Algorytm wykorzystuje zespoloną pulsację chwilową dla klasyfikacji mowy na dźwięczną i bezdźwięczną oraz estymacji częstotliwości podstawowej dla każdej próbki sygnału. Skuteczność klasyfikacji oraz dokładność estymacji zostały ocenione eksperymentalnie z wykorzystaniem dwóch baz nagrań, zawierających wypowiedzi...
-
Odbiór zbiorczy z filtracją adaptacyjną RLS w transmisji danych w kanale hydroakustycznym
PublikacjaTransmisja danych w kanale hydroakustycznych realizowana jest w trudnych warunkach propagacyjnych. Jednym z problemów podczas takiej transmisji są zakłócenia międzysymbolowe (ISI – intersymbol interference) spowodowane głównie przez efekt wielodrogowości. To zjawisko utrudnia, bądź uniemożliwia transmisję danych w takim kanale. Stąd podjęto analizę wpływu zastosowania odbioru zbiorczego oraz filtracji adaptacyjnej RLS (Recursive...
-
Ewa Hermanowicz prof. dr hab. inż.
Osoby -
Strategie treningu neuronowego estymatora częstotliwości tonu krtaniowego z użyciem generatora syntetycznych samogłosek
PublikacjaW wielu zastosowaniach telekomunikacyjnych pojawia się problem przetwarzania lub analizy sygnału mowy, w ramach którego, często w obszarze podstawowych algorytmów, stosuje się estymator częstotliwości tonu krtaniowego. Estymator rozpatrywany w tej pracy bazuje na neuronowym klasyfikatorze podejmującym decyzje na podstawie częstotliwości oraz mocy chwilowej wyznaczanych w podpasmach analizowanego sygnału mowy. W pracy rozważamy...
-
Projekt radiowej sieci tablic informacyjnych do zastosowań wewnątrzbudynkowych
PublikacjaZaprojektowana radiowa sieć tablic informacyjnych jest siecią złożoną z jednego węzła nadrzędnego w postaci kontrolera tablic oraz z przynajmniej dwóch węzłów podrzędnych, zwanych tablicami, zrealizowanych z wykorzystaniem platformy Raspberry Pi. Transmisja danych między węzłami sieci odbywa się w sposób bezprzewodowy z wykorzystaniem standardu Bluetooth, zaś przesyłane dane są danymi multimedialnymi, możliwymi do zaprezentowania...
-
Advanced speech archiving and restoration system for aviation applications
PublikacjaW referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów - jest to niezwykle istotne w...
-
Konfrontowanie reprezentatywnych struktur spektralnych odpowiedzi impulsowej kanału głosowego
PublikacjaEwidentne zróżnicowanie nawyków artykulacyjnych charakterystyczne dla dźwięków mowy różnych języków zmusza do odnajdywania znaczących podobieństw nie w obrazie akustycznym mowy swobodnej, a jedynie w jej zawoalowanych fragmentach odpowiedzialnych za przekaz kodu informacji (sensu). W pracy omówiono metody i rezultaty automatycznego kwalifikowania wybranych leksemów trzech systemów języka na podstawie konfrontowania ich cyfrowych...
-
Cifrovaâ reprezentaciâ leksem russkogo âzyka
PublikacjaKonfrontowanie zasobów leksyki pokrewnych systemów języka etnicznego w celu określenia stopnia zbieżności przynależnych im homonimik wymaga stosowania wysublimowanych procedur językoznawczych mających na celu oszacowanie wspólnoty akustycznej zawartej w paralelnych parlacjach użytkowników owych języków. Ewidentne zróżnicowanie nawyków aktu artykulacji a zwłaszcza, co szczególnie istotne, nieświadomego procesu intelektualnej percepcji...
-
Nowe metody przetwarzania sygnałów w wybranych zagadnieniach wibroakustyki
PublikacjaMonografia Nowe Metody Przetwarzania Sygnałów w Wybranych Zagadnieniach Wibroakustyki będąca piętnastym Tomem z serii Monografie Katedry Automatyzacji Procesów AGH w Krakowie poświęcona jest zagadnieniom związanym z zastosowaniem i wykorzystaniem metod przetwarzania sygnałów wibroakustycznych w wybranych problemach technicznych i medycznych. W pierwszym rozdziale niniejszej monografii przedstawiono zagadnienia dotyczące metod przetwarzania...