Search results for: WYKRYWANIE MOWY RÓWNOCZESNEJ

Search results for: WYKRYWANIE MOWY RÓWNOCZESNEJ

results on page:
embed this view on your website

Filters

total: 244

clear all filters disabled

A low complexity double-talk detector based on the signal envelope
Publication
- SIGNAL PROCESSING - Year 2008
A new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...

Full text available to download
KORPUS MOWY ANGIELSKIEJ DO CELÓW MULTIMODALNEGO AUTOMATYCZNEGO ROZPOZNAWANIA MOWY
Publication
- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Year 2016
W referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus...
Bożena Kostek prof. dr hab. inż.

People

Laboratorium Akustyki Fonicznej
AUTOMATYCZNA KLASYFIKACJA MOWY PATOLOGICZNEJ
Publication
- M. Włoszczyńska
- B. Kostek
- Year 2023
Aplikacja przedstawiona w niniejszym rozdziale służy do automatycznego wykrywania mowy patologicznej na podstawie bazy nagrań. W pierwszej kolejności przedstawiono założenia leżące u podstaw przeprowadzonych badan wraz z wyborem bazy mowy patologicznej. Zaprezentowano również zastosowane algorytmy oraz cechy sygnału mowy, które pozwalają odróżnić mowę niezaburzoną od mowy patologicznej. Wytrenowane sieci neuronowe zostały następnie...

Full text to download in external service
Akustyka Mowy - 2022
e-Learning Courses
- J. Kotus
- G. Szwoch
- A. Czyżewski
Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.
Akustyka Mowy - 2023
e-Learning Courses
- J. Kotus
- G. Szwoch
- A. Czyżewski
Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.
Akustyka Mowy - 2024
e-Learning Courses
- J. Kotus
- G. Szwoch
Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.
Analiza sygnału mowy w foniatrii
Publication
- A. Kaczmarek
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Year 2006
Praca zawiera opis algorytmów analizy sygnału mowy opracowanych do zastosowań medycznych. Mają one znaczenie wspomagające w diagnostyce schorzeń krtani, objawiających się jako np. chrypka, dwugłos oraz nieprawidłowa artykulacja tonu krtaniowego (głos drżący). Opisano algorytmy służące do ekstrakcji tonu krtaniowego (parametr F0 i jego przebieg zmienności w czasie) oraz do wygładzania widma (np. do estymacji parametrów formantowych...

Full text available to download
Metoda oceny skuteczności cyfrowego korektora mowy
Publication
- P. Odya
- Prace Naukowe Instytutu Telekomunikacji i Akustyki Politechniki Wrocławskiej. Konferencje - Year 2003
Cyfrowy korektor mowy, który został opracowany w Katedrze Inżynierii Dźwięku i Obrazu PG, jest urządzeniem pozwalającym na poprawę płynności mowy osób jąkających się z wykorzystaniem nowego typu metodykę modyfikacji audytoryjnej pętli sprzężenia zwrotnego. W niniejszej pracy zawarto podstawowe informacje na temat wady wymowy, jaką jest jąkanie się oraz na temat opracowanego korektora.
Wykorzystanie analizy obrazu w rozpoznawaniu mowy
Publication
- P. Dalka
- B. Kostek
- Year 2005
Niniejszy referat przedstawia metodę rozpoznawania mowy na podstawie analizy ruchu ust. W pracy opisano algorytm wyznaczana i śledzenia położenia ust wykorzystujący modele Active Shape Models oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. W pracy umieszczono wyniki klasyfikacji oraz wnioski.
System rozpoznawania mowy wykorzystujący cechy wizualne
Publication
- P. Dalka
- B. Kostek
- Year 2005
Niniejszy artykuł przedstawia metodę rozpoznawania głosek na podstawie analizy ruchu ust, która może znaleźć zastosowanie w terapii logopedycznej osób z wadami słuchu. W pracy opisano algorytm wyznaczana i śledzenia położenia ust oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. Dodatkowo przeprowadzono...
Badanie jakości transmisji mowy w sieciach IP.
Publication
- Year 2004
Praca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telekomunikacyjnym. Zrealizowano symulację transmisji pakietowej sygnału mowy w sieci Internet (VoIP). Wykonano serię testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.
Wykrywanie zdarzeń drogowych z wykorzystaniem telematyki transportu
Publication
- J. Oskarbski
- Logistyka - Year 2011
W ostatnich latach na terenie Polski możemy zaobserwować intensyfikację wdrożeń środków i metod Inteligentnych Systemów Transportu. Zaawansowane systemy zarządzania i sterowania ruchem lub ich elementy pojawiają się zarówno na polskich autostradach, jak i w obszarach sieci dróg miejskich. Jedną z funkcji, jaką realizować mogą systemy zarządzania ruchem jest zarządzanie incydentami, którego elementem jest wykrywanie zdarzeń drogowych....
POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU
Publication
- K. Kąkol
- B. Kostek
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Year 2018
Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w...

Full text available to download
Metodyka oceny skuteczności cyfrowego korektora mowy
Publication
- P. Odya
- Year 2003
W pracy zawarto podstawowe informacje na temat jąkania i zasad działania korektora. Skupiono się na zagadnieniu oceny postępów w terapii z wykorzystaniem ankiet i tzw. próby sylabowej. Zawarto również wyniki wstępnych analiz materiałów przesyłanych z poradni. Ponadto opisano krótko algorytmy które posłużą do automatycznej detekcji zaburzeń mowy.
Biometria i przetwarzanie mowy 2023
e-Learning Courses
- J. Daciuk
{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
Biometria i przetwarzanie mowy 2024
e-Learning Courses
- J. Daciuk
{mlang pl} Celem kursu jest zapoznanie studentów z: metodami ustalania i potwierdzania tożsamości ludzi na podstawie mierzalnych cech organizmu cechami mowy ludzkiej, w szczególności polskiej metodami rozpoznawania mowy metodami syntezy mowy {mlang} {mlang en} The aim of the course is to familiarize the students with: methods of identification and verification of identity of people based on measurable features of their...
Wykorzystanie sieci neuronowych do syntezy mowy wyrażającej emocje
Publication
- S. Zaporowski
- Year 2019
W niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opratych na mowie i możliwości ich wykprzystania w syntezie mowy z emocjami stosując do tego celu sieci neuronowe. Wskazano również przydatnośc parametrów typowo stosowanych do rozpoznawania mowy w detekcji emocji w śpiewie i rozróżnianiu tych emocji w obu przypadkach. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy...
WYKORZYSTANIE SIECI NEURONOWYCH DO SYNTEZY MOWY WYRAŻAJĄCEJ EMOCJE
Publication
- S. Zaporowski
- B. Kostek
- Year 2018
W niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opartych na mowie i możliwości ich wykorzystania w syntezie mowy z emocjami, wykorzystując do tego celu sieci neuronowe. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy mowy za pomocą sieci neuronowych. Obecnie obserwuje się znaczny wzrost zainteresowania i wykorzystania uczenia głębokiego w aplikacjach związanych...
Badanie jakości transmisji mowy w sieciach IP.
Publication
- Year 2004
Praca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telefonicznym VoIP. Wykorzystano symulacje transmisji pakietowej sygnału w sieci IP. Wykonano serie testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.
Wykrywanie obiektów ferromagnetycznych w obszarze o dużych lokalnych anomaliach magnetycznych
Publication
- M. Wołoszyn
- Year 2008
Ziemskie pole magnetyczne jest równomierne w ograniczonym obszarze. Istnieją na kuli ziemskiej obszary o dużych lokalnych anomaliach magnetycznych. Wykrywanie obiektów ferromagnetycznych z zastosowaniem czujników magnetycznych zainstalowanych na mobilnych platformach (np. śmigłowcach) w obszarze występowania dużych lokalnych anomalii magnetycznych jest w istotny sposób utrudnione. W pracy przedstawiono model matematyczny pola magnetycznego...
Nowy system cyfrowej transmisji sygnału mowy o szybkości 16 kbit/s
Publication
- Ł. Waga
- Elektronika : konstrukcje, technologie, zastosowania - Year 2003
Celem pracy jest przedstawienie nowego systemu cyfrowej transmisji sygnału mowy wykorzystującego kanał cyfrowy o prędkości transmisji 16 kbit/s. Nowa metoda kodowania sygnału mowy zaproponowana w pracy pozwala zmniejszyć czterokrotnie, w porównaniu z telefonią cyfrową, wymaganą szybkość transmisji, przy zachowaniu akceptowanej jakości przesyłanej mowy, a jednocześnie nie wymaga drogich numerycznie algorytmów wykorzystywanych w...
Różnica w subiektywnej ocenie jakości mowy pomiędzy nastolatkami dwujęzycznymi a jednojęzycznymi
Publication
- P. Falkowski-Gilski
- S. Brachmański
- M. Kin
- A. Dobrucki
- Year 2021
Proces percepcji mowy omawiany jest w szerokim zakresie dziedzin i dyscyplin naukowych, od nauk humanistycznych, technicznych, aż po nauki medyczne. Wiele badań skupia się np. na ocenie różnicy w grupach bez i z wykształceniem muzycznym. Skoro stwierdzono, że zdolności muzyczne wpływają na percepcję poszczególnych atrybutów dźwięku, autorzy postanowili zbadać, czy zdolności językowe także mogą mieć wpływ na ocenę jakości sygnału...

Full text to download in external service
Wykrywanie on-line anomalii w odebranym sygnale PSK za pomocą zespolonej pulsacji chwilowej
Publication
- K. Świder
- L. Philips
- R. Rykaczewski
- M. Rojewski
- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Year 2010
Jednym z głównych problemów w analizie sygnałów PSK (ang. Phase Shift Keying) jest wykrywanie anomalii występujących w sygnale odebranym. Większość urządzeń stosowanych do analizy sygnałów PSK (np. oscyloskopy cyfrowe, analizatory widma) w celu wykrycia anomalii wykorzystuje algorytm EVM (ang. Error Vector Magnitude) w którym bada się, on-line, różnicę między konstelacją PSK, a skupieniami odebranych symboli zespolonych. W związku...
Novel approaches to wideband speech coding
Publication
- M. Kulesza
- A. Czyżewski
- Year 2008
Dwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...

Full text to download in external service
Metody równoczesnej akwizycji w systemach z napięciowymi i częstotliwościowymi torami pomiarowymi
Publication
- D. Świsulski
- Przegląd Elektrotechniczny - Year 2012
Przedstawiono metody przetwarzania sygnału impulsowego modulowanego częstotliwościowo. Opisane metody pozwalają na odtworzenie wartości wielkości mierzonej dla tych samych chwil czasu, w których próbkowane są sygnały w torach napięciowych.
Cyfrowy system rejestracji i rekonstrukcji sygnału mowy dla potrzeb Lotnictwa Wojskowego.
Publication
- A. Czyżewski
- A. Kaczmarek
- J. Kotus
- A. Pawlik
- A. Rypulak
- P. Żwan
- Year 2004
W referacie przedstawiono ogólną charakterystykę opracowanego systemu rejestracji i rekonstrukcji sygnału mowy. Zamieszczono opis poszczególnych składników systemu, które stanowi zestaw zaawansowanych narzędzi do rejestracji, analizy i rekonstruowania mowy, zrealizowany w formie oprogramowania komputerowego. Narzędzia te pozwalają na szybkie wyszukiwanie pożądanych fragmentów nagrań oraz poprawę ich jakości na drodze redukcji szumów,...
Szybkie wykrywanie wirusa grypy we wczesnej fazie rozwoju za pomocą sensorów nanodiamentowych domieszkowanych borem
Publication
- D. Nidzworski
- S. Katarzyna
- P. Niedzialkowski
- R. Bogdanowicz
- M. Sobaszek
- J. Ryl
- P. Weiher
- S. Mirosław
- E. Wnuk
- A. Jarmillo-Botero... and 2 others
- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Year 2022
Przedstawiono konstrukcję i wyniki wstępnych badań szybkiego elektrochemicznego sensora wykonanego na bazie cienkich warstw nanokrystalicznego diamentu domieszkowanego borem, który umożliwia wykrywanie śladowych ilości wirusa grypy we wczesnej fazie rozwoju. Zapewnia to identyfikację ognisk pandemii.

Full text to download in external service
DWUKIERUNKOWY PRZEWODOWY SYSTEM TRANSMISJI MOWY PRZY WYKORZYSTANIU TECHNOLOGII BPL
Publication
- P. Jedlikowski
- G. Debita
- P. Falkowski-Gilski
- M. Habrych
- B. Miedziński
- J. Wandzio
- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Year 2019
Monitorowanie pracowników w środowisku podziemnym jest niezwykle ważnym zadaniem. Z uwagi na możliwe zagrożenia, konieczne jest opracowanie niezawodnego systemu komunikacji głosowej pomiędzy personelem a przełożonym. Dzięki wysokiej odporności na uszkodzenia mechaniczne, kable zasilające pracujące w technice BPL (Broadband over Power Line) wydają się doskonałym rozwiązaniem. W pracy przedstawiono w pełni funkcjonalny dwukierunkowy...

Full text to download in external service
Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej
Publication
- M. [. Kaniewska
- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Year 2007
W pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.
Wpływ rozmieszczenia źródeł w rozproszonym systemie rozgłoszeniowym na zrozumiałość mowy.
Publication
- R. Mazurek
- J. Adamczyk
- H. Lasota
- Year 2003
Dźwiękowe systemy ostrzegawcze instalowane w obiektach użyteczności publicznej muszą zapewniać odpowiednio wysoką zrozumiałość mowy. W praktyce systemy nagłośnieniowe nie zawsze spełniają to kryterium. Referat przedstawia badania symulacyjne dwóch systemów wykorzystujących rozproszone układy źródeł.Celem badań jest określenie związków między geometrią rozkładu źródeł a zrozumiałością mierzoną parametrem RASTI.
Early detection of imminent threats in social relation graphs
Publication
- R. Brendel
- H. Krawczyk
- Year 2007
Wczesne wykrywanie zagrożeń i anomalii w sieciach społecznych jest dziś prawdziwym wyzwaniem. Ludzie w realnym świecie tworzą wiele złożonych relacji społecznych, które mogą być przedstawione za pomocą grafów, w których węzły reprezentują aktorów (pojedyncze osoby lub organizacje) a krawędzie wskazują na powiązania pomiędzy nimi. Analiza nieustannie zmieniających się relacji pomiędzy aktorami może wskazać konkretne nadciągające...
Jakość transmisji sygnałów mowy w systemie gsm z hoppingiem częstotliwościowym
Publication
- D. Rutkowski
- J. Żurek
- Year 2005
W pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na polepszenie charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Dotyczą one podstawowego parametru służącego do oceny jakości transmisji, jakim jest stopa błędów. W badaniach uwzględniono różne liczby częstotliwości nośnych uczestniczących w hoppingu, prędkości przemieszczania się terminali i środowiska propagacyjne.
Weryfikacja systemu dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie
Publication
- P. Suchomski
- Prace Naukowe Instytutu Telekomunikacji i Akustyki Politechniki Wrocławskiej. Konferencje - Year 2003
Większość systemów dopasowania protez słuchu koncentruje się na poprawie zrozumiałości mowy. Problem dopasowania protez słuchu może w uproszczeniu być przedstawiony jako problem dopasowania szerokiej dynamiki sygnału mowy do zawężonej dynamiki uszkodzonego słuchu. Głównym celem badań było przetestowanie opracowanego systemu oraz sprawdzenie w jakim stopniu zaimplementowany moduł wirtualnej protezy słuchu może poprawić zrozumiałość...
Wczesne wykrywanie spoofingu GNSS typu carry-off
Publication
- J. Magiera
- Year 2018
W referacie przedstawiono klasyfikację ataków typu spoofing ukierunkowanych na odbiorniki satelitarnych systemów nawigacyjnych GNSS. W szczególności opisano zaawansowaną formę spoofingu w wariancie tzw. carry-off, polegającym na płynnym przejęciu kontroli nad blokami śledzenia sygnałów w zakłócanym odbiorniku. Sposób realizacji takiego ataku istotnie utrudnia jego wykrycie z użyciem metod dotychczas proponowanych w literaturze....
A hybrid speech codec employing parametric and perceptual coding techniques
Publication
- Year 2006
W referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...
Wykorzystanie algorytmu kompresji sygnału mowy MP-LPC do modelowania przebiegu fonokardiograficznego
Publication
- G. Redlarski
- D. Gradolewski
- Przegląd Elektrotechniczny - Year 2013
W artykule przedstawiono nową metodę modelowania dźwięków serca, która może znaleźć zastosowanie w systemach diagnostyki urządzeń medycznych oraz stanowić podstawę opracowania inteligentnego stetoskopu. Przedstawiona propozycja stanowi rozwinięcie algorytmu MP-LPC wykorzystywanego w kompresji sygnału mowy. Wykazano, że do dokładnego modelowania przebiegu fonokardiograficznego, który pozwala na odwzorowywanie różnorodnych stanów...

Full text to download in external service
Wykrywanie sygnałów z widmem rozproszonym o małej mocy
Publication
- K. Bronk
- R. Katulski
- J. Magiera
- J. Stefański
- R. Studański
- R. Wąs
- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Year 2010
Niniejszy artykuł podzielony został na trzy części. Pierwsza z nich zawiera opis koncepcji oraz schemat blokowy stanowiska do wykrywania sygnałów z widmem rozproszonym o małej mocy. Ponadto, w tej części jest zaprezentowana realizacja praktyczna takiego stanowiska. Część druga jest charakterystyką oprogramowania, realizującego cyfrowe przetwarzanie sygnałów i stanowiącego interfejs użytkownika dla operatora stanowiska. W ostatniej...
ANALIZA PARAMETRÓW SYGNAŁU MOWY W KONTEKŚCIE ICH PRZYDATNOŚCI W AUTOMATYCZNEJ OCENIE JAKOŚCI EKSPRESJI ŚPIEWU
Publication
- S. Zaporowski
- B. Kostek
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Year 2019
Praca dotyczy podejścia do parametryzacji w przypadku klasyfikacji emocji w śpiewie oraz porównania z klasyfikacją emocji w mowie. Do tego celu wykorzystano bazę mowy i śpiewu nacechowanego emocjonalnie RAVDESS (Ryerson Audio-Visual Database of Emotional Speech and Song), zawierającą nagrania profesjonalnych aktorów prezentujących sześć różnych emocji. Następnie obliczono współczynniki mel-cepstralne (MFCC) oraz wybrane deskryptory...

Full text available to download
Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu
Publication
- A. Kupryjanow
- Year 2013
Przedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu...
Interaktywne badania słuchu, wzroku i mowy
Publication
- A. Czyżewski
- H. Skarżyński
- Elektronizacja: podzespoły i zastosowania elektroniki - Year 2002
Telemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results
Publication
- Z. Wojan
- W. Lis
- K. Wojan
- Year 2005
W artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...
Wykrywanie sygnałów o mocach mniejszych niż czułość zestawu odbiorczego
Publication
- A. Czapiewska
- R. Wąs
- R. Studański
- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Year 2012
W referacie przedstawiono metody przetwarzania/rejestracji sygnałów o mocach nieprzekraczających czułości zestawu odbiorczego zastosowanego dla potrzeb wykrywania takich sygnałów. Opisano stanowisko badawcze oraz założenia przyjęte do badań. Przedstawiono wyniki badań.
Wykrywanie prostych w obrazie cyfrowym z wykorzystaniem transformacji Hougha
Publication
- P. Kowalski
- R. Smyk
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Year 2018
Artykuł prezentuje eksperymentalną analizę wpływu szumu o założonym poziomie na skuteczność wykrywania prostych w obrazie przy użyciu algorytmu Hougha. Analizę przeprowadzono przy użyciu opracowanej aplikacji obejmującej realizację procedury generacji szumu oraz algorytmu automatycznie wyznaczającego liczbę pikseli w funkcji jasności w przestrzeni Hougha. Zbadano wpływ poziomu szumu na różnicę w liczbach pikseli tworzących prostą...

Full text available to download
Biometria i przetwarzanie mowy 2025
e-Learning Courses
- J. Daciuk
Granie nie tylko na murawie! Zostań Lewandowskim pipety i termocyklera. Synergia nowoczesnych metod analitycznych opartych o wykrywanie DNA z nowymi formami nauczania (grywalizacja).
Publication
- P. Filipkowski
- Pismo PG - Year 2022
KOnkurs Innowacji Dydaktyznych PG: "Granie nie tylko na murawie! Zostań Lewandowskim pipety i termocyklera. Synergia nowoczesnych metod analitycznych opartych o wykrywanie DNA z nowymi formami nauczania (grywalizacja)."

Full text available to download
Cyfrowa analiza mowy etnicznej - ekstrakcja kodu informacji.
Publication
- Z. Wojan
- W. Lis
- K. Wojan
- Year 2003
W artykule zaprezentowano spektrogramy leksemów wyartykułowanych przez (zróżnicowanych co do płci i wieku) użytkowników jednego języka etnicznego wyrażonych w mowie swobodnej. Ponadto, przedstawiono spektrogramy tychże leksemów uzyskane po cyfrowym wyeliminowaniu w nich sygnału tonu krtaniowego. Dla porównania pokazano spektrogramy uzyskane w wyniku identycznego procesu przetwarzania sygnałów będących akustyczną reprezentacją...
High quality speech coding using combined parametric and perceptual modules. [Kodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego]
Publication
- Transaction on Engineering, Computation and Technology - Year 2006
W komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne...

Full text to download in external service
Wdrażanie innowacji przełomowych w oparciu o wykrywanie przelotnych szans rynkowych
Publication
- A. Lis
- Year 2015
W niniejszym rozdziale została omówiona koncepcja innowacji przełomowej, stworzona przez C. M. Christensena. Prezentowana koncepcja wpisuje się w szkołę prostych reguł zarządzania strategicznego, a jej podstawowym założeniem jest unikanie konkurencji poprzez oferowanie produktów o odmiennej hierarchii parametrów od tych, które cenią aktualni odbiorcy na rynku. Wychwytywanie szans na innowację w koncepcji innowacji przełomowej polega...
Wykrywanie nieruchomego bagażu w obrazach z kamer monitoringu portu lotniczego
Publication
- G. Szwoch
- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Year 2013
W referacie opisano nowy algorytm wykrywania nieruchomego bagażu w obrazach z kamer monitoringu wizyjnego. Obiekty ruchome są wykrywane w obrazie i analizowane pod kątem zmienności pikseli. Obiekty zidentyfikowane jako nieruchome są analizowane przez klasyfikator, który wykrywa bagaż na podstawie deskryptorów kształtu. Dodatkowo eliminowane są fałszywe obiekty, powstające na etapie odejmowania tła. Zadaniem algorytmu jest uzyskanie...

Full text to download in external service

Search

Filters

Catalog

Search results for: WYKRYWANIE MOWY RÓWNOCZESNEJ

Bożena Kostek prof. dr hab. inż.