Search results for: POPRAWA ZROZUMIAŁOŚCI MOWY
-
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
PublicationW pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.
-
POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU
PublicationCelem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w...
-
Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm
PublicationW artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...
-
Improving signal quality in speech codec using hybrid perceptual-parametric algorithm. [Poprawa jakości sygnału w kodekach mowy przy użyciu hybrydowego, parametryczno-perceptualnego algorytmu kodowania]
PublicationPrzedstawiono hybrydową, parametryczno-perceptualną architekturę kodeka. Podstawowa struktura kodeka parametrycznego CELP została wzbogacona o kodowanie perceptualne. Celem hybrydyzacji kodeka jest uzyskanie znaczącej poprawy subiektywnej jakości zdekodowanego sygnału. Zaproponowano dwie hybrydowe struktury. Pierwsza polega na perceptualnym kodowaniu dźwięcznych elementów sygnału rezydualnego kodeka CELP. Druga metoda dzieli sygnał...
-
Sposób poprawy zrozumiałości mowy w wielokanałowym sygnale multimedialnym, zwłaszcza wizyjno-fonicznym i układ do realizacji tego sposobu
Inventions -
A system for multitask noisy speech enhancement.
PublicationW artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy...
-
Weryfikacja systemu dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie
PublicationWiększość systemów dopasowania protez słuchu koncentruje się na poprawie zrozumiałości mowy. Problem dopasowania protez słuchu może w uproszczeniu być przedstawiony jako problem dopasowania szerokiej dynamiki sygnału mowy do zawężonej dynamiki uszkodzonego słuchu. Głównym celem badań było przetestowanie opracowanego systemu oraz sprawdzenie w jakim stopniu zaimplementowany moduł wirtualnej protezy słuchu może poprawić zrozumiałość...
-
Multitask Noisy Speech Enhancement System
PublicationW referacie opisano Wielozadaniowy System Poprawy Jakości Sygnału Mowy. Jest to wyspecjalizowany pakiet oprogramowania przeznaczony do rejestrowania sygnału mowy i do poprawy jego jakości oraz zrozumiałości mowy, przy użyciu zaawansowanych procedur cyfrowego przetwarzania sygnału. Pakiet oprogramowania składa się z programów: Rejestrator, Przeglądarka oraz Rekonstruktor. Oprogramowanie to może być użyte w przypadkach, gdy zrozumiałość...
-
Advanced speech archiving and restoration system for aviation applications
PublicationW referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów - jest to niezwykle istotne w...
-
Badanie dźwiękowego systemu ostrzegawczego w sali kinowej pod kątem zgodności z normą
PublicationElementem infrastruktury ewakuacyjnej obiektów użytku publicznego, zwłaszcza przeznaczonych dla imprez masowych, jest autonomiczny system akustyczny odpowiadający wymaganiom normy PN-EN 60849 "Dźwiękowe systemy ostrzegawcze". Referat przedstawia metodykę i wyniki pomiarów podstawowych parametrów akustycznych systemu "ewakuacji głosowej" zainstalowanego w sali typowego multikina, ze szczególnym uwzględnieniem parametrów określających...
-
Komputerowe modelowanie dźwiękowodu aparatu słuchowego
PublicationW artykule opisano metodę komputerowego modelowania dźwiękowodu aparatu słuchowego. Model opracowany został z wykorzystaniem metody falowodowej. Symulacje komputerowe umożliwiają zbadanie właściwości akustycznych dźwiękowodów o różnych parametrach. Opisany model może zostać zastosowany w systemie dopasowywania aparatu słuchowego do potrzeb jego użytkownika, w celu zminimalizowania zniekształceń dźwięku wprowadzanych przez dźwiękowód...
-
Wpływ prędkości terminala i liczby częstotliwości nosnych na jakość odbioru w systemie GSM z hoppingiem częstotliwościowyn
PublicationW pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na poprawę charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Charakterystyki te obrazują wpływ prędkości przemieszczania się terminala ruchomego oraz liczby częstotliwości nośnych wykorzystywanych w stacji bazowej do hoppingu na wartość Eb/N0, w różnych środowiskach propagacyjnych. Osiągana poprawa jakości jest szczególnie znacząca przy małych...
-
Modelowanie i pomiary nagłośnienia audytorium
PublicationUwaga projektantów systemów nagłośnieniowych zogniskowana jest na tzw. akustyce pomieszczenia, w którym realizowany jest przekaz słowny. Zjawiska pogłosowe związane z geometrią sali audytoryjnej, wynikające z wielokrotnych odbić fali dźwiękowej uznawane są za dominujące. Artykuł podejmuje niedoceniany problem wpływu liczby i rozmieszczenia głośników w sali na jakość przekazu. Superpozycji sygnałów dochodzących do słuchacza z wielu...
-
KORPUS MOWY ANGIELSKIEJ DO CELÓW MULTIMODALNEGO AUTOMATYCZNEGO ROZPOZNAWANIA MOWY
PublicationW referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus...
-
Cyfrowy system rejestracji i rekonstrukcji sygnału mowy dla potrzeb Lotnictwa Wojskowego.
PublicationW referacie przedstawiono ogólną charakterystykę opracowanego systemu rejestracji i rekonstrukcji sygnału mowy. Zamieszczono opis poszczególnych składników systemu, które stanowi zestaw zaawansowanych narzędzi do rejestracji, analizy i rekonstruowania mowy, zrealizowany w formie oprogramowania komputerowego. Narzędzia te pozwalają na szybkie wyszukiwanie pożądanych fragmentów nagrań oraz poprawę ich jakości na drodze redukcji szumów,...
-
Bożena Kostek prof. dr hab. inż.
People -
Akustyka Mowy - 2022
e-Learning CoursesCelem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.
-
Akustyka Mowy - 2023
e-Learning CoursesCelem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.
-
Akustyka Mowy - 2024
e-Learning CoursesCelem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.
-
AUTOMATYCZNA KLASYFIKACJA MOWY PATOLOGICZNEJ
PublicationAplikacja przedstawiona w niniejszym rozdziale służy do automatycznego wykrywania mowy patologicznej na podstawie bazy nagrań. W pierwszej kolejności przedstawiono założenia leżące u podstaw przeprowadzonych badan wraz z wyborem bazy mowy patologicznej. Zaprezentowano również zastosowane algorytmy oraz cechy sygnału mowy, które pozwalają odróżnić mowę niezaburzoną od mowy patologicznej. Wytrenowane sieci neuronowe zostały następnie...
-
Analiza sygnału mowy w foniatrii
PublicationPraca zawiera opis algorytmów analizy sygnału mowy opracowanych do zastosowań medycznych. Mają one znaczenie wspomagające w diagnostyce schorzeń krtani, objawiających się jako np. chrypka, dwugłos oraz nieprawidłowa artykulacja tonu krtaniowego (głos drżący). Opisano algorytmy służące do ekstrakcji tonu krtaniowego (parametr F0 i jego przebieg zmienności w czasie) oraz do wygładzania widma (np. do estymacji parametrów formantowych...
-
Metoda oceny skuteczności cyfrowego korektora mowy
PublicationCyfrowy korektor mowy, który został opracowany w Katedrze Inżynierii Dźwięku i Obrazu PG, jest urządzeniem pozwalającym na poprawę płynności mowy osób jąkających się z wykorzystaniem nowego typu metodykę modyfikacji audytoryjnej pętli sprzężenia zwrotnego. W niniejszej pracy zawarto podstawowe informacje na temat wady wymowy, jaką jest jąkanie się oraz na temat opracowanego korektora.
-
Wykorzystanie analizy obrazu w rozpoznawaniu mowy
PublicationNiniejszy referat przedstawia metodę rozpoznawania mowy na podstawie analizy ruchu ust. W pracy opisano algorytm wyznaczana i śledzenia położenia ust wykorzystujący modele Active Shape Models oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. W pracy umieszczono wyniki klasyfikacji oraz wnioski.
-
Koncepcja dobrej praktyki "Poprawa wizerunku sądu"
PublicationW dokumencie pt. „Koncepcja wdrożenia dobrej praktyki – poprawa wizerunku sądu” przedstawiony został opis, wspomnianej powyżej dobrej praktyki. Warto również zwrócić uwagę na powiązanie tej praktyki z innymi proponowanymi praktykami: a) sąd w otoczeniu społecznym oraz b) organizacja i funkcjonowanie BOI.
-
System rozpoznawania mowy wykorzystujący cechy wizualne
PublicationNiniejszy artykuł przedstawia metodę rozpoznawania głosek na podstawie analizy ruchu ust, która może znaleźć zastosowanie w terapii logopedycznej osób z wadami słuchu. W pracy opisano algorytm wyznaczana i śledzenia położenia ust oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. Dodatkowo przeprowadzono...
-
Badanie jakości transmisji mowy w sieciach IP.
PublicationPraca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telekomunikacyjnym. Zrealizowano symulację transmisji pakietowej sygnału mowy w sieci Internet (VoIP). Wykonano serię testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.
-
Managerial Accounting (POPRAWA)
e-Learning Courses -
Biometria i przetwarzanie mowy 2023
e-Learning Courses{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
-
Biometria i przetwarzanie mowy 2024
e-Learning Courses{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
-
Metodyka oceny skuteczności cyfrowego korektora mowy
PublicationW pracy zawarto podstawowe informacje na temat jąkania i zasad działania korektora. Skupiono się na zagadnieniu oceny postępów w terapii z wykorzystaniem ankiet i tzw. próby sylabowej. Zawarto również wyniki wstępnych analiz materiałów przesyłanych z poradni. Ponadto opisano krótko algorytmy które posłużą do automatycznej detekcji zaburzeń mowy.
-
Wykorzystanie sieci neuronowych do syntezy mowy wyrażającej emocje
PublicationW niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opratych na mowie i możliwości ich wykprzystania w syntezie mowy z emocjami stosując do tego celu sieci neuronowe. Wskazano również przydatnośc parametrów typowo stosowanych do rozpoznawania mowy w detekcji emocji w śpiewie i rozróżnianiu tych emocji w obu przypadkach. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy...
-
WYKORZYSTANIE SIECI NEURONOWYCH DO SYNTEZY MOWY WYRAŻAJĄCEJ EMOCJE
PublicationW niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opartych na mowie i możliwości ich wykorzystania w syntezie mowy z emocjami, wykorzystując do tego celu sieci neuronowe. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy mowy za pomocą sieci neuronowych. Obecnie obserwuje się znaczny wzrost zainteresowania i wykorzystania uczenia głębokiego w aplikacjach związanych...
-
Badanie jakości transmisji mowy w sieciach IP.
PublicationPraca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telefonicznym VoIP. Wykorzystano symulacje transmisji pakietowej sygnału w sieci IP. Wykonano serie testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.
-
Nowy system cyfrowej transmisji sygnału mowy o szybkości 16 kbit/s
PublicationCelem pracy jest przedstawienie nowego systemu cyfrowej transmisji sygnału mowy wykorzystującego kanał cyfrowy o prędkości transmisji 16 kbit/s. Nowa metoda kodowania sygnału mowy zaproponowana w pracy pozwala zmniejszyć czterokrotnie, w porównaniu z telefonią cyfrową, wymaganą szybkość transmisji, przy zachowaniu akceptowanej jakości przesyłanej mowy, a jednocześnie nie wymaga drogich numerycznie algorytmów wykorzystywanych w...
-
Różnica w subiektywnej ocenie jakości mowy pomiędzy nastolatkami dwujęzycznymi a jednojęzycznymi
PublicationProces percepcji mowy omawiany jest w szerokim zakresie dziedzin i dyscyplin naukowych, od nauk humanistycznych, technicznych, aż po nauki medyczne. Wiele badań skupia się np. na ocenie różnicy w grupach bez i z wykształceniem muzycznym. Skoro stwierdzono, że zdolności muzyczne wpływają na percepcję poszczególnych atrybutów dźwięku, autorzy postanowili zbadać, czy zdolności językowe także mogą mieć wpływ na ocenę jakości sygnału...
-
Novel approaches to wideband speech coding
PublicationDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...
-
Struktura zespołu projektowego dla wdrożenia dobrej praktyki pod nazwą "Poprawa wizerunku sądu"
PublicationW rozdziale przedstawiono strukturę projektową zespołu wdrażania praktyki zarządczej Poprawa wizerunku sądu. Wskazano na zadania i role poszczególnych członków zespołu
-
Poprawa nośności platform roboczych
PublicationW artykule przedstawiono zagadnienia związanie z zastosowaniem geosyntetyków oraz materiałów wiązanych hydraulicznie (HBM) do stabilizacji platform roboczych pod ciężki sprzęt budowlany.
-
DWUKIERUNKOWY PRZEWODOWY SYSTEM TRANSMISJI MOWY PRZY WYKORZYSTANIU TECHNOLOGII BPL
PublicationMonitorowanie pracowników w środowisku podziemnym jest niezwykle ważnym zadaniem. Z uwagi na możliwe zagrożenia, konieczne jest opracowanie niezawodnego systemu komunikacji głosowej pomiędzy personelem a przełożonym. Dzięki wysokiej odporności na uszkodzenia mechaniczne, kable zasilające pracujące w technice BPL (Broadband over Power Line) wydają się doskonałym rozwiązaniem. W pracy przedstawiono w pełni funkcjonalny dwukierunkowy...
-
Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej
PublicationW pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.
-
Wpływ rozmieszczenia źródeł w rozproszonym systemie rozgłoszeniowym na zrozumiałość mowy.
PublicationDźwiękowe systemy ostrzegawcze instalowane w obiektach użyteczności publicznej muszą zapewniać odpowiednio wysoką zrozumiałość mowy. W praktyce systemy nagłośnieniowe nie zawsze spełniają to kryterium. Referat przedstawia badania symulacyjne dwóch systemów wykorzystujących rozproszone układy źródeł.Celem badań jest określenie związków między geometrią rozkładu źródeł a zrozumiałością mierzoną parametrem RASTI.
-
Jakość transmisji sygnałów mowy w systemie gsm z hoppingiem częstotliwościowym
PublicationW pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na polepszenie charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Dotyczą one podstawowego parametru służącego do oceny jakości transmisji, jakim jest stopa błędów. W badaniach uwzględniono różne liczby częstotliwości nośnych uczestniczących w hoppingu, prędkości przemieszczania się terminali i środowiska propagacyjne.
-
A hybrid speech codec employing parametric and perceptual coding techniques
PublicationW referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...
-
Wykorzystanie algorytmu kompresji sygnału mowy MP-LPC do modelowania przebiegu fonokardiograficznego
PublicationW artykule przedstawiono nową metodę modelowania dźwięków serca, która może znaleźć zastosowanie w systemach diagnostyki urządzeń medycznych oraz stanowić podstawę opracowania inteligentnego stetoskopu. Przedstawiona propozycja stanowi rozwinięcie algorytmu MP-LPC wykorzystywanego w kompresji sygnału mowy. Wykazano, że do dokładnego modelowania przebiegu fonokardiograficznego, który pozwala na odwzorowywanie różnorodnych stanów...
-
ANALIZA PARAMETRÓW SYGNAŁU MOWY W KONTEKŚCIE ICH PRZYDATNOŚCI W AUTOMATYCZNEJ OCENIE JAKOŚCI EKSPRESJI ŚPIEWU
PublicationPraca dotyczy podejścia do parametryzacji w przypadku klasyfikacji emocji w śpiewie oraz porównania z klasyfikacją emocji w mowie. Do tego celu wykorzystano bazę mowy i śpiewu nacechowanego emocjonalnie RAVDESS (Ryerson Audio-Visual Database of Emotional Speech and Song), zawierającą nagrania profesjonalnych aktorów prezentujących sześć różnych emocji. Następnie obliczono współczynniki mel-cepstralne (MFCC) oraz wybrane deskryptory...
-
Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu
PublicationPrzedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu...
-
Interaktywne badania słuchu, wzroku i mowy
PublicationTelemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.
-
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results
PublicationW artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...
-
Poprawa jakości złączy rurowych poprzez ich blokowanie
PublicationSieci infrastruktury wodociągowo - kanalizacyjnej. Złącze rurowe, charakterystyki normowe zachowań złączy. Obciążenia działające na złącza - problem odporności. Możliwość poprawy jakości złączy poprzez ich blokowanie (stabilizowanie). Różnice zachowań rur oraz zbudowanych rurociągów w wyniku braku adekwatności połączeń.
-
Andrzej Czyżewski prof. dr hab. inż.
PeopleProf. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...
-
Cyfrowa analiza mowy etnicznej - ekstrakcja kodu informacji.
PublicationW artykule zaprezentowano spektrogramy leksemów wyartykułowanych przez (zróżnicowanych co do płci i wieku) użytkowników jednego języka etnicznego wyrażonych w mowie swobodnej. Ponadto, przedstawiono spektrogramy tychże leksemów uzyskane po cyfrowym wyeliminowaniu w nich sygnału tonu krtaniowego. Dla porównania pokazano spektrogramy uzyskane w wyniku identycznego procesu przetwarzania sygnałów będących akustyczną reprezentacją...
-
High quality speech coding using combined parametric and perceptual modules. [Kodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego]
PublicationW komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne...
-
Blok na łączu. Poprawa jakości sztywnych złączy rurowych.
PublicationProblem uelastycznienia złącza (w rozumieniu normy) poprzez jego zablokowanie. Cechy charakterystyczne złączy. Zachowanie złącza sztywnego w zmieniającym się podłożu gruntowym.
-
Simulation of electric hearing - influence of simulation parameters on quality of output signal
PublicationW środowisku programistycznym Matlab stworzono symulację słuchu elektrycznego pacjenta implantowanego. W symulacji zastosowano algorytm przetwarzania wykorzystywany w komercyjnych systemach implantów ślimakowych - CIS (Continuous Interleaved Sampling). W pracy zbadano wpływ ilości kanałów, jak i innych parametrów sygnałów wyjściowych przy zastosowaniu sygału mowy jako sygnału wejściowego symulacji.
-
Poprawa rozdzielczości pomiarów TDOA w radionawigacyjnym odbiorniku DS-CDMA
PublicationReferat przedstawia propozycję poprawy rozdzielczości pomiaru różnic czasów nadejścia sygnałów (TDOA) w odbiorniku DS-CDMA do celów radiolokalizacyjnych i radionawigacyjnych przy użyciu pętli śledzenia fazy ciągu rozpraszającego wykorzystującej filtry ułamkowoopóźniające. Opisana jest budowa i funkcjonowanie proponowanego rozwiązania wraz z wynikami badań laboratoryjnych.
-
Poprawa jakości obrazów parametrycznych w termografii dynamicznej w medycynie
PublicationObrazy parametryczne, uzyskiwane na drodze syntezy z badań dynamicznych CT, MRI i innych modalności, są coraz bardziej popularne w diagnostyce medycznej. Artykół prezentuje w jaki sposób można poprawić jakość otrzymywanych obrazów parametrycznych w aktywnej termografii dynamicznej (ADT).
-
Poprawa niezawodności silnika przez monitoring i zmniejszenie temperatury pracy
PublicationW artykule przedstawiono metody pomiaru temperatury izolacji silników oraz sposób wyznaczenia temperatury dopuszczalnej w danych warunkach otoczenia.
-
Audiovisual speech recognition for training hearing impaired patients
PublicationPraca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...
-
Głębokie przetwarzanie tekstu i sygnału mowy 2022
e-Learning Courses -
Głębokie przetwarzanie tekstu i sygnału mowy 2023
e-Learning Courses -
Subiektywny pomiar jakości sygnałów mowy i muzyki w lokalnych multipleksach radiofonii DAB+ w Gdańsku i Wrocławiu
PublicationRadiofonia cyfrowa DAB+ (Digital Audio Broadcasting plus) dostępna jest dla słuchaczy w Polsce od 2013 r. Standard ten oferuje szerokie możliwości konfiguracji multipleksów lokalnych nie tylko pod względem liczby, lecz także jakości nadawanych programów radiowych. Dzięki temu możliwe jest dostosowanie parametrów emitowanych sygnałów w celu sprostania oczekiwaniom odbiorców końcowych. W przeciwieństwie do radiofonii analogowej FM...
-
Poprawa kontrastu termicznego na potrzeby kalibracji kamer dla termicznej stereowizji
Publication.
-
Poprawa kontrastu termicznego na potrzeby kalibracji kamer dla termicznej stereowizji.
Publication.
-
Poprawa warunków koegzystencji wąsko- i ultraszerokopasmowych transmisji radiowych - wyniki pomiarów
PublicationReferat przedstawia pokrótce zaproponowaną przez autorów metodę zmniejszania ryzyka wystąpienia zakłóceń w pracy urządzeń wąskopasmowych powodowanych przez transmisje UWB według stan-dardu IEEE 802.15.4a poprzez modyfikację widma sygnału ultraszerokopasmowego. Główną część pracy stanowi prezentacja wyników pomiarów laboratoryjnych jakości odbioru sygnałów wąskopasmowych w obecności zakłóceń impulsowych bez modyfikacji widma oraz...
-
Piotr Odya dr inż.
PeoplePiotr Odya was born in Gdansk in 1974. He received his M.Sc. in 1999 from the Faculty of Electronics, Telecommunications and Informatics, Gdansk University of Technology, Poland. His thesis was related to the problem of sound quality improvement in the contemporary broadcasting studio. He is interested in video editing and multichannel sound systems. The goal of Mr. Odya Ph.D. thesis concerned methods and algorithms for correcting...
-
Mechanika Budowli sem. IV inż Budownictwo stacjonarne - 2022/23 - poprawa
e-Learning CoursesPodstawy analizy układów statycznie niewyznaczalnych. Zagadnienia stateczności i nośności granicznej układów prętowych. Wykorzystanie linii wpływu układów statycznie niewyznaczalnych
-
Wartościowanie i ironia w tekście w świetle teorii aktów mowy
Publication -
Poprawa bezpieczeństwa osób z niepełnosprawnością podczas ewakuacji z obiektów użyteczności publicznej
PublicationObecne przepisy budowlane nie zapewniają osobom z niepełnosprawnością pełnego bezpieczeństwa na wypadek pożaru. W artykule zarysowane zostaną obszary problemowe związane z technicznymi warunkami zapewnienia tym osobom bezpiecznej ewakuacji z budynku. Przedstawione zostaną przykłady rozwiązań zwiększających bezpieczeństwo tych osób oraz sposoby ewakuacji przy pomocy środków technicznych. Poruszona zostanie tematyka dostępu do informacji...
-
Wykonanie ekspertyzy budowlanej dotyczącej sposobu wykonania tunelu realizowanego w ramach zadania pn. ,,Poprawa dostępności komunikacyjnej w Wejherowie poprzez budowę metropolitalnego węzła integracyjnego oraz tunelu w ciągu ulicy Kwiatowej"
PublicationCelem opracowania jest ocena wykonalności i poprawności proponowanych dwóch rozwiązań projektowych wykonania tunelu w ciągu ul. Kwiatowej w Wejherowie realizowanego w ramach zadania pn. ,,Poprawa dostępności komunikacyjnej w Wejherowie poprzez budowę metropolitalnego węzła integracyjnego oraz tunelu w ciągu ulicy Kwiatowej" wraz z oceną kosztów ich realizacji.
-
Badanie właściwości sygnału telegraficznego oraz sygnału mowy przesyłanych przez kanał analogowy
PublicationW pracy zaprezentowano oprogramowanie TELESOUND, które powstało na potrzeby ćwiczenia pt. "Właściwości źródeł informacji" realizowanego w ramach laboratorium "Podstaw telekomunikacji". W trakcie tego ćwiczenia studenci zapoznają się z podstawowymi pojęciami i mechanizmami funkcjonowania systemów telekomunikacyjnych przekazujących wiadomości na odległość poprzez kanał przestrzenny. Na przykładzie telegrafii i telefonii, studenci...
-
Poprawa bezpieczeństwa stosowania kosmetyków dla dzieci poprzez dobór składników o działaniu myjącym
Publication -
Improvement of impulse radio electromagnetic compatibility
PublicationPublikacja zawiera opis jednej z możliwych technik modyfikacji widma sygnału ultraszerokopasmowego radia impulsowego na przykładzie standardu IEEE 802.15.4a, opartą o zmianę struktury sekwencji generowanych impulsów o bardzo krótkim czasie trwania. Technika ta może zmniejszyć ryzyko wzajemnych zakłóceń pomiędzy nowymi urządzeniami ultraszerkopasmowymi a istniejącymi urządzeniami radiokomunikacji wąskopasmowej
-
Poprawa wskaźników jakościowych i ekonomicznych w procesie przecinania ściernicowego rotacyjnego przy podejściu mechatronicznym
PublicationOpracowano metodę przecinania ściernicowego, które ma duże znaczenie w zas-tosowaniu do przecinania prętów z materiałów trudno skrawalnych. W metodzie tej zastosowane układy kinematyczne umożliwiające optymalizację parametrów procesu. Do sterowania parametrami technologicznymi zaprojektowano programo-wy system sterowania, który zapewnia utrzymanie optymalnych parametrów wprocesie obróbkowym. Dzięki temu uzyskano poprawę wskaźników.
-
Akustyczny obraz słowa na tle mowy etnicznej [The acoustic image of ethnic speech words]
Publication -
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
PublicationThis paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
-
A low complexity double-talk detector based on the signal envelope
PublicationA new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...
-
Badanie rozkładów parametrów sygnału mowy w zastosowaniach do prognozowania prawdopodobieństwa popełnienia błędów w systemach identyfikacji mówców = Examining distribution of speech signal parameters for the prognosis of error probability in speaker verification systems
PublicationPrzedmiotem pracy jest system identyfikacji mówców w sposób zależny od tekstu ("text dependent''). Dokonano analizy wielu różnych wypowiedzi kilkudziesięciu mówców. Zastosowana metoda parametryzacji to metoda oparta na wynikach analizy cepstralnej sygnału mowy. Zdefiniowane zostały nowe parametry skojarzone z elementarnymi zdarzeniami w procesie weryfikacji mówców. Na tej podstawie dokonano estymacji funkcji gęstości prawdopodobieństwa...
-
Poprawa sprawności układów ORC i systemów trigeneracyjnych poprzez zastosowanie różnych termodynamicznych wariantów ich działania
PublicationNadrzędnym celem w procesie projektowania instalacji opartej o układy ORC (Organic Rankine Cycle) i systemy trigeneracyjne jest uzyskanie możliwie najwyższej sprawności lub maksymalnej mocy układu. Jednak naturalną barierą wdrażania nowych, często kosztownych, technologii są przesłanki natury ekonomicznej. Niedoceniany również bywa w takich przypadkach efekt ekologiczny ewentualnej modernizacji. Niniejsza praca przedstawia systemowe...
-
Zintegrowany Program Rozwoju Politechniki Gdańskiej – Moduł 1. Poprawa jakości kształcenia na studiach stacjonarnych II stopnia
PublicationPolitechnika Gdańska realizuje od 1 kwietnia 2018 roku projekt „Zintegrowany Program Rozwoju Politechniki Gdańskiej” (POWER 3.5) dofinansowywany ze środków Unii Europejskiej z Europejskiego Funduszu Społecznego w ramach Programu Operacyjnego „Wiedza Edukacja Rozwój”. W artykule zostały przedstawione informacje dotyczące realizacji zadań szczegółowych modułu 1, będącego pierwszym zadaniem z trzech określonych w projekcie. Artykuł...
-
Poprawa właściwości sedymentacyjnych osadu czynnego w reaktorach typu SBR i metody szybkiej oceny tych właściwości
PublicationPorównano różne metody oceny właściwości sedymentacyjnych osadu czynnego, w tym indeks objętościowo-wagowy osadu oraz bezpośredni pomiar szybkości opadania osadu na głębokość 4 m w reaktorze w oczyszczalni ścieków. Stwierdzono, iż ocena właściwości sedymentacyjnych osadu w obiekcie rzeczywistym umożliwia szybki dobór parametrów sterowania oczyszczalnią ścieków.
-
Cyfrowa analiza mowy etnicznej – ekstrakcja kodu informacji [A digital analysis of ethnic speech – deciphering the information code]
Publication -
Insight into the microbial and genetic response of anammox biomass to broad range concentrations of different antibiotics: Linking performance and mechanism
Publication -
Metodyka i system dopasowanie protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie.
Publication.
-
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych [A system of speech signal processing and visualisation for linguistic purposes]
Publication -
Transient detection for speech coding applications
PublicationSignal quality in speech codecs may be improved by selecting transients from speech signal and encoding them using a suitable method. This paper presents an algorithm for transient detection in speech signal. This algorithm operates in several frequency bands. Transient detection functions are calculated from energy measured in short frames of the signal. The final selection of transient frames is based on results of detection...
-
The improvement and evaluation methods of settling properties of activated sludge
PublicationW biologicznych oczyszczalniach ścieków często pojawiają się problemy z sedymentacją osadu czynnego. Złe właściwości sedymentacyjne osadu często powodowane są nadmiernym rozwojem bakterii nitkowatych. W pracy przedstawiono koncepcję poprawy właściwości sedymentacyjnych osadu czynnego, opartą na kontroli parametrów pracy reaktorów SBR - temperatury, stężenia tlenu oraz czasu opadania osadu w komorze.
-
Improving operating efficiency of a gas turboset via cooperation with an absorption refrigerating machine
PublicationThe analysis of increase of ambient air temperature entering the compressor on reduction in power output from the turbine and increase fuel use was conduced. For medium size gas turbine operates in winter and summer conditions elementary power and economical values was calculated. Conditions of the determination of turbine inlet air cooling solution (using thermal storage for reduce equipment size) are presented
-
Opinia o innowacyjności: Poprawa konkurencyjności przedsiębiorstwa TES Sp. z o.o. dzięki wdrożeniu innowacyjności procesowej w produkowanych maszynach rozdmuchowych
PublicationPrzedstawiono opinię dotyczącą rozwiązania do optymalizacji i monitoringu maszyn rozdmuchowych na etapie ich testowania, bezpośrednio przed wysyłką do klienta.
-
Poprawa jakości odbioru w interfejsie radiowym TEDS systemu TETRA poprzez redukcję mocy szumu w estymacie odpowiedzi impulsowej kanału
Publication -
Language material for English audiovisual speech recognition system developmen . Materiał językowy do wykorzystania w systemie audiowizualnego rozpoznawania mowy angielskiej
PublicationThe bi-modal speech recognition system requires a 2-sample language input for training and for testing algorithms which precisely depicts natural English speech. For the purposes of the audio-visual recordings, a training data base of 264 sentences (1730 words without repetitions; 5685 sounds) has been created. The language sample reflects vowel and consonant frequencies in natural speech. The recording material reflects both the...
-
Analyzing and improving a mechanistic model for the Microthrix parvicella in activated sludge systems
PublicationW pracy przedstawiono wyniki estymacji parametrów dla mechanistycznego modelu bakterii Microthrix parvicella w systemach osadu czynnego. W tym celu wykorzystano dane z oczyszczalni ścieków w Szwajcarii oraz wyniki dodatkowych badań laboratoryjnych w reaktorze nieprzepływowym. Model właściwie prognozował szybkość poboru tlenu (mierzoną dla różnych substratów) oraz zawartść bakterii Microthrix w biomasie osadu czynnego.
-
Improving denitrification efficiency at the "Wschod" WWTP in Gdansk (Poland) - effects of different carbon sources
PublicationCelem badań było określenie wpływu dawkowania trzech różnych źródeł węgla (ścieków po oczyszczaniu mechanicznym, metanolu, ścieków gorzelnianych) na szybkość denitryfikacji, mierzoną w warunkach laboratoryjnych z osadem czynnym z oczyszczalni ścieków Gdańsk-Wschód. Największą szybkość procesu (4.8-5.2 mgN/(g*h)) zaobserwowano dla ścieków przemysłowych. Dodatkowo przeprowadzono badanie długości fazy adaptacji osadu do metanolu w...
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublicationIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublicationIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Improving quality of life in automotive by professional preparation to external audits
PublicationZaproponowano podniesienie jakości procesów zarządzania w przemyśle samochodowym w oparciu o rozbudowany model profesjonalnego przygotowania i późniejszego wykorzystania wyników zewnętrznych audytów.
-
High quality speech codec employing sines+noise+transients model
PublicationA method of high quality wideband speech signal representation employing sines+transients+noise model is presented. The need for a wideband speech coding approach as well as various methods for analysis and synthesis of sines, residual and transient states of speech signal is discussed. The perceptual criterion is applied in the proposed approach during encoding of sines amplitudes in order to reduce bandwidth requirements and...
-
Jan Daciuk dr hab. inż.
PeopleJan Daciuk received his M.Sc. from the Faculty of Electronics of Gdansk University of Technology in 1986, and his Ph.D. from the Faculty of Electronics, Telecommunications and Informatics of Gdańsk University of Technology in 1999. He has been working at the Faculty from 1988. His research interests include finite state methods in natural language processing and computational linguistics including speech processing. Dr. Daciuk...
-
Speech codec enhancements utilizing time compression and perceptual coding
PublicationA method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband...
-
Michał Wróbel dr inż.
PeopleMichał Wróbel, Assistant Professor of Gdańsk University of Technology, computer scientist, a specialist in software engineering. I graduated from the Faculty of Electronics Technical University of Gdansk in 2002 with a degree in Computer Science, with specialization in Software Engineering and Databases. Until 2006 I worked as system administrator in several companies, including CI TASK. Since 2006 I have been working at the Faculty...
-
Anna Remiszewska-Skwarek dr inż.
People