Search results for: kodowanie sygnalu mowy
-
Vowel recognition based on acoustic and visual features
PublicationW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...
-
Sravnitel'no-sopostavitel'nyj analiz cifrovoj reprezentacii leksem s differencirovannoj akcentuaciej
PublicationArtykuł poświęcony jest językoznawczej analizie kontrastywnej dźwięków mowy systemów języka cechujących się "płynnym" akcentowaniem homograficznych leksemów. Język rosyjski jest na wskroś reprezentatywnym przykładem takiego właśnie systemu. W prezentowanej tu metodzie analizy materiałem wyjściowym są cyfrowe nagrania mowy żywej artykułowanej przez lektorów języka rosyjskiego. Akustyczna (cyfrowa) reprezentacja leksemów o tożsamej...
-
New generation artificial larynx
PublicationCelem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz....
-
Speech formant frequency and pitch estimation using instantaneous complex frequency
PublicationW pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.
-
New approach to localization of clicks in archive speech signals.
PublicationPrzedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.
-
Zespolona pulsacja chwilowa w analizie i konwersji głosu
PublicationPrzedstawiona rozprawa doktorska dotyczy badania głosu z wykorzystaniem reprezentacji sygnału mowy za pomocą zespolonej pulsacji chwilowej (ICF od ang. Instantaneous Complex Frequency). Zespolona pulsacja chwilowa opiera się na koncepcji rzeczywistej częstotliwości chwilowej (IF od ang. Instantaneous Frequency), która estymuje częstotliwość sygnału w każdej chwili czasu jako pochodną jego fazy chwilowej. Główną zaletą takiego podejścia...
-
Korekta akustyczna sali wykładowej Politechniki Lwowskiej
PublicationPraca omawia korektę akustyczną sali wykładowej, cechującą się dużą pogłosowością i małą zrozumiałością mowy. Sala znajduje się w zabytkowym budynku. Przedstawiono kroki prowadzące do poprawy akustyki, z uwzględnieniem ograniczeń wynikających z historycznego charakteru sali.
-
Broadband interference in speech reinforcement systems
PublicationArtykuł podejmuje niedoceniany problem wpływu liczby i rozkładu głośników w systemach nagłośnienia, na jakość przekazu głosowego, czyli na zrozumiałość mowy w audytoriach. Superpozycji przesuniętych w czasie szerokopasmowych sygnałów o tym samym kształcie i lekko różnych wielkościach, które docierają do słuchacza z licznych spójnych źródeł, towarzyszy zjawisko interferencji prowadzące do głębokiej modyfikacji odbieranych sygnałów...
-
On the use of instantaneous complex frequency for pitch and formant tracking.
PublicationW pracy opisano algorytm śledzenia częstotliwości podstawowej i formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. Działanie algorytmu przetestowano na nagraniach polskich samogłosek, których wysokość zmieniała się płynnie. Wyniki testów wraz z porównaniem działania opisanej metody i metody predykcji liniowej zawarto w artykule.
-
Józef Gołuchowski - profesor filozofii w Wilnie.
PublicationW artykule przedstawiono krótki rys biograficzny Józefa Gołuchowskiego (1797-1858) do czasu wydalenia go z Wilna przez władze carskie. Omówiono sprawę jego nominacji oraz odwołania, a także okoliczności, które sprawiły, że nie było mu dane wygłoszenie mowy na uroczystości zakończenia roku akad. 1823/1824.
-
Matematyczne zagadnienia analizy sygnału 2022/23
e-Learning Courses -
Matematyczne zagadnienia analizy sygnału 2024/25
e-Learning Courses -
Matematyczne Zagadnienia Analizy Sygnału 2023/24
e-Learning Courses -
Diagnostyka słuchu i zagrożeń hałasowych
PublicationW pierwszej części referatu przedstawiono przesiewową metodę diagnostyki słuchu. Szczegółowo opisano różne rodzaje testów przesiewowych. Zamieszczono dyskusję zastosowanej audiometrii mowy w słuchu. W drugiej części przedstawiono aktualnie opracowywany system zdalnego monitorowania zagrożeń hałasowych. Oprócz ogólnej charakterystyki systemu przedstawiono szczegółowy opis jego poszczególnych elementów składowych.
-
Urządzenie do pomiaru i rejestracji przepływu wydmuchiwanego przez człowieka strumienia powietrza
InventionsWynalazek obejmuje zastosowanie urządzenia jako interfejsu człowiek-komputer w interaktywnych grach komputerowych wykorzystywanych np. do wspomagania treningu oddechowego w terapii mowy; dotyczy to również sposobu prowadzenia terapii, bądź rehabilitacji poprzez ćwiczenia oddechowe, gdzie ustalane są dolne i górne wartości graniczne rejestrowanego ciśnienia i/lub prędkości wydmuchiwanego strumienia powietrza i/lub...
-
Accoustic verification of onomatopoeic sets in contrastive approach
PublicationPraca relacjonuje efekty prób wykorzystania technik cyfrowego przetwarzania sygnału mowy dla zaspokojenia specyficznych potrzeb nauk humanistycznych, które, ograniczając się wyłącznie do tra-dycyjnie stosowanego warsztatu badawczego, napotykają współcześnie na bariery znacznie blokują-ce oczekiwany postęp. Omówiono proces badawczy, który służyć ma językoznawcom dokonującym porównań wyrażeń dźwiękonaśladowczych odnajdywanych w odmiennych...
-
Miary jakości transmisji głosu w technologii VoIP.
PublicationPrzedstawiono i omówiono czynniki decydujące o jakości mowy takie jak: opóźnienie tak charakterystyczne dla sieci IP a głównie jego fluktuacja, utraty pakietów podczas transmisji, rozmiar pakietu oraz zjawisko echa zbliżonego jadalnego. Jakość transmisji uzależniono od elementów występujących w łącznej sieci telekomunikacyjnej typu PSTN, bram oraz sieci IP.
-
Badanie dźwiękowego systemu ostrzegawczego w sali kinowej pod kątem zgodności z normą
PublicationElementem infrastruktury ewakuacyjnej obiektów użytku publicznego, zwłaszcza przeznaczonych dla imprez masowych, jest autonomiczny system akustyczny odpowiadający wymaganiom normy PN-EN 60849 "Dźwiękowe systemy ostrzegawcze". Referat przedstawia metodykę i wyniki pomiarów podstawowych parametrów akustycznych systemu "ewakuacji głosowej" zainstalowanego w sali typowego multikina, ze szczególnym uwzględnieniem parametrów określających...
-
Teoria informacji i kodowania - semestr zimowy 2022/2023
e-Learning CoursesKurs jest przeznaczony jako narzędzie wspomagające zajęcia wykładowe i ćwiczenia z przedmiotu "Teoria informacji i kodowanie".
-
Bazy Danych
e-Learning CoursesBazy danych, pojęcia podstawowe, modele danych , obsługa baz danych, j. SQL , kodowanie interfejsu do baz danych
-
ALOFON Methodology and technology for the polymodal allophonic speech transcription
ProjectsProject realized in Department of Multimedia Systems according to UMO-2015/17/B/ST6/01874 agreement from 2016-02-19
-
Dwupunktowy estymator pulsacji chwilowej w zastosowaniu do estymacji tonu krtaniowego.
PublicationPrzedstawiono algorytm do estymacji wartości tzw. tonu krtaniowego działający z wykorzystaniem banku zespolonych filtrów wąskopasmowych oraz dwupunktowego estymatora pulsacji chwilowej, który wykorzystuje tylko bieżącą próbkę i poprzednią. Bank zespolonych filtrów półoktawowych został specjalnie dobrany do właściwości analizowanego sygnału mowy i wymagań nieliniowego przetwarzania następującego po nim. W pracy zamieszczono wyniki...
-
Rozdział 28 : Inteligentne odtwarzanie przesyłanych danych w systemie komórkowym UMTS
PublicationW pracy przedstawiono zagadnienia przetwarzania sygnałów w torze nadawczo-odbiorczym systemu UMTS, w którym kanał wywołuje skrajnie trudne warunki transmisji i to zarówno w relacji od terminala do stacji bazowej jak i w przeciwnym kierunku. Szczególną uwagę zwrócono na kodowanie/dekodowanie kanałowe oraz rozpraszanie/skupianie widma sygnałów. Przedstawiono wyniki badania jakości odbioru dla kodu splotowego (3,1,9) i turbokodu ukazując...
-
DEVELOPMENT OF THE ALGORITHM OF POLISH LANGUAGE FILM REVIEWS PREPROCESSING
PublicationThe algorithm and the software for conducting the procedure of Preprocessing of the reviews of films in the Polish language were developed. This algorithm contains the following steps: Text Adaptation Procedure; Procedure of Tokenization; Procedure of Transforming Words into the Byte Format; Part-of-Speech Tagging; Stemming / Lemmatization Procedure; Presentation of Documents in the Vector Form (Vector Space Model) Procedure; Forming...
-
Zaawansowane Techniki Przetwarzania Sygnału - Nowy kopiuj 3
e-Learning CoursesPodstawowe pojęcia dotyczące filtracji cyfrowej (w tym próbkowanie nierównomierne), analiza widmowa (estymacja gęstości widmowej mocy, widma wyższych rzędów), zjawisko rezonansu stochastycznego, filtr Wienera i Kalmana, liniowa i nieliniowa filtracja adaptacyjne, analiza czasowo-częstotliwościowa, metody odszumiania sygnałów, metody regresji i detekcji według algorytmów PCA i SVM, metody kodowania sygnałów audio i video, modem...
-
Zaawansowane Techniki Przetwarzania Sygnału - r.akad 2024/25
e-Learning CoursesPodstawowe pojęcia dotyczące filtracji cyfrowej (w tym próbkowanie nierównomierne), analiza widmowa (estymacja gęstości widmowej mocy, widma wyższych rzędów), zjawisko rezonansu stochastycznego, filtr Wienera i Kalmana, liniowa i nieliniowa filtracja adaptacyjne, analiza czasowo-częstotliwościowa, metody odszumiania sygnałów, metody regresji i detekcji według algorytmów PCA i SVM, metody kodowania sygnałów audio i video, modem...
-
Komputerowe modelowanie dźwiękowodu aparatu słuchowego
PublicationW artykule opisano metodę komputerowego modelowania dźwiękowodu aparatu słuchowego. Model opracowany został z wykorzystaniem metody falowodowej. Symulacje komputerowe umożliwiają zbadanie właściwości akustycznych dźwiękowodów o różnych parametrach. Opisany model może zostać zastosowany w systemie dopasowywania aparatu słuchowego do potrzeb jego użytkownika, w celu zminimalizowania zniekształceń dźwięku wprowadzanych przez dźwiękowód...
-
Estymacja tonu krtaniowego w oparciu o zespoloną pulsację chwilową
PublicationW niniejszej pracy zaproponowano nową metodę ekstrakcji tonu krtaniowego w oparciu o zespoloną pulsacjęchwilową - ICF (ang. Instantaneous Complex Frequency). Zaproponowano interaktywny algorytm analizy ICF sygnałumowy, którego wyniki udokumentowano zarówno w dziedzinie czasu (na płaszczyźnie Arganda) jak i w dziedzinieczęstotliwości. Na podstawie osiągniętych wyników wykazano bezpośredni, jednoznaczny związek pomiędzy okresemtonu...
-
Reprezentatywne dla danego języka spektra odpowiedzi impulsowej kanału głosowego = English language specific spectrum generated in the human vocal tract
PublicationW pracy omówiono wybrane problemy ekstrakcji kodu informacji zawartego w dźwiękach mowy etnicznej. Autorzy, wykorzystując kompilację własnych i firmowych algorytmów, wydzielają w procesie wygładzania cepstralnego z cyfrowego zapisu dźwięków mowy naturalnej strukturę spektralną pobudzenia tonem krtaniowym i szumem oraz strukturę spektralną kanału głosowego modulującego to pobudzenie. W następnym kroku powstają -statystycznie reprezentatywne...
-
Wpływ prędkości terminala i liczby częstotliwości nosnych na jakość odbioru w systemie GSM z hoppingiem częstotliwościowyn
PublicationW pracy przedstawiono wyniki badań wpływu hoppingu częstotliwościowego na poprawę charakterystyk jakościowych systemu GSM dla transmisji sygnałów mowy. Charakterystyki te obrazują wpływ prędkości przemieszczania się terminala ruchomego oraz liczby częstotliwości nośnych wykorzystywanych w stacji bazowej do hoppingu na wartość Eb/N0, w różnych środowiskach propagacyjnych. Osiągana poprawa jakości jest szczególnie znacząca przy małych...
-
Zastosowanie inżynierii dźwięku i obrazu w medycynie
PublicationWynikiem opracowań Katedry Systemów Multimedialnych PG we współpracy z Instytutem Fizjologii i Patologii Słuchu w Warszawie jest zestaw narzędzi komputerowych do badania słuchu oraz rozwiązanie systemowe masowych badań przesiewowych słuchu, mowy i wzroku oparte na zastosowaniu współczesnych technologii teleinformatycznych. Niektóre wdrożone aplikacje i systemy z dziedziny diagnostyki słuchu, mające w znacznej mierze charakter oryginalny,...
-
Combining visual and acoustic modalities to ease speech recognition by hearing impaired people
PublicationArtykuł prezentuje system, którego celem działania jest ułatwienie procesu treningu poprawnej wymowy dla osób z poważnymi wadami słuchu. W analizie mowy wykorzystane zostały parametry akutyczne i wizualne. Do wyznaczenia parametrów wizualnych na podstawie kształtu i ruchu ust zostały wykorzystane modele Active Shape Models. Parametry akustyczne bazują na współczynnikach melcepstralnych. Do klasyfikacji wypowiadanych głosek została...
-
Projekt systemu nagłośnieniowego z wykorzystaniem oprogramowania CATT-Acoustic.
PublicationW niniejszej pracy zawarto projekt modelu akustycznego sali audytoryjnej oraz weryfikację charakterystyk pola akustycznego tego modelu w oparciu o program CATT-Acoustic. W pracy przedstawiono również projekt systemu nagłośnienia modelowanej sali audytoryjnej, który z punktu widzenia właściwości akustycznych powinien zapewnić jak najlepszą zrozumiałość mowy. Dokonano analizy porównawczej pola akustycznego bez oraz z zaimplementowanym...
-
Hearing aid operating in acoustical free field
PublicationAparatowanie bardzo małych dzieci (od 5 miesiąca życia) za pomocą standardowych protez słuchu natrafia na wiele trudności natury praktycznej. Dotyczy to procesu dopasowania aparatu słuchowego, czyli doboru jego ustawień stosownie do aktualnych charakterystyk ubytku słuchu dzieci. Tymczasem wczesne aparatowanie jest zagadnieniem o ogromnym zanczeniu dla rozwoju słuchu, mowy i ogólnej inteligencji dziecka. Referat prezentuje uzyskane...
-
Telemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy
PublicationDzięki pomiarom odpowiedzi neuronalnych i możliwości wyznaczenia na tej podstawie tendencji rozkładu progów stymulacji można lepiej zaprogramować procesor mowy. Jest to niezwykle cenne zwłaszcza u pacjentów nie współpracujących podczas badań (na przykład u małych dzieci). W przypadku takich pacjentów tradycyjne, psychoakustyczne metody doboru parametrów stymulacji przez implant często zawodzą. Natomiast gdy audiolog dysponuje prawdopodobną...
-
Speech recognition system for hearing impaired people.
PublicationPraca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...
-
PRZEGLĄD METOD PRZETWARZANIA DŹWIĘKU WYKORZYSTYWANYCH W APARATACH SŁUCHOWYCH
PublicationNiniejszy artykuł odnosi się do aktualnego stanu technologii wykorzystywanych w cyfrowych aparatach słuchowych, ze szczególnym uwzględnieniem technik cyfrowego przetwarzania sygnałów dźwiękowych. W artykule przedstawiono czynniki mające wpływ na efektywność aparatów słuchowych, a także zaprezentowano przykłady nowoczesnych metod cyfrowego przetwarzania sygnałów. Przedstawiono również przykłady ograniczeń współczesnych aparatów...
-
Internet-based automatic hearing assessment system
PublicationCelem referatu jest prezentacja systemu przesiewowego badania słuchu w oparciu o Internet. Wady słuchu stanowią jedną z najszybciej postępujących chorób we współczesnym społeczeństwie. W tym kontekście ważne staje się umożliwienie przeprowadzania masowych testów wykrywających ubytki słuchu. Przedstawiona aplikacja zawiera audiometryczny test tonalny, test ilustrowany dla dzieci oraz test rozumienia mowy w szumie. Po zakończeniu...
-
Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową
PublicationW pracy zaprezentowano oryginalny algorytm estymacji wysokości chwilowej dźwięku. Wykorzystuje on zespolone filtry cyfrowe Hilberta o różnej szerokości pasm przepustowych. W eksperymentach posłużono się filtami nacelowanymi na wyznaczanie częstotliwości krtaniowej (odwrotności okresu drgań strun głosowych) na podstawie zarejestrowanych samogłosek wypowiadanych głosem męskim, żeńskim i dziecięcym. W algorytmie zastosowano estymator...
-
Zastosowanie sieci neuronowych w cyfrowej syntezie dźwięku
PublicationRozwój technik związanych z uczeniem maszynowym umożliwia nowe podejście i nowe definiowanie wielu dotychczasowych problemów. Heurystyczne algorytmy stosowane do problemów takich jak klasyfikacja danych w postaci wektorów cech, czy wyróżnianie grup obiektów o podobnych własnościach mogą znaleźć także zastosowanie w takich dziedzinach jak analiza i synteza dźwięków muzycznych. W referacie przybliżone zostały podstawowe zasady projektowania...
-
System wspomagania rozumienia mowy
Inventions -
Investigations of speech signal parameters with regard to articulation influences
PublicationW pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...
-
Finite automata for compact representation of tuple dictionaries.
PublicationOpisane zostaje uogólnienie struktury danych - słownika, zwane słownikiem n-tek. Słownik n-tek przedstawia odwzorowanie n-tek łańcuchów znaków na pewne wartości. Motywacją dla powstania tej struktury danych są praktyczne zastosowania w przetwarzaniu języka i mowy, w których obszerne słowniki n-tek używane są do przedstawiania modeli języka. Przedstawiona zostaje technika oszczędnej reprezentacji słowników n-tek. Ta technika...
-
Deep neural networks for data analysis
e-Learning CoursesThe aim of the course is to familiarize students with the methods of deep learning for advanced data analysis. Typical areas of application of these types of methods include: image classification, speech recognition and natural language understanding. Celem przedmiotu jest zapoznanie studentów z metodami głębokiego uczenia maszynowego na potrzeby zaawansowanej analizy danych. Do typowych obszarów zastosowań tego typu metod należą:...
-
Lokalizacja tekstu w obrazie
PublicationW naturalnym otoczeniu człowieka znajduje się duża ilość łatwo rozpoznawalnej informacji przedstawionej w postaci znaków graficznych i tekstu. Informacja taka jest bardzo przydatna w poruszaniu się w środowisku miejskim. Niestety, osoby z upośledzonymi funkcjami wzroku w sposób oczywisty pozbawione są możliwości korzystania z tego rodzaju przekazu. Istniejące na rynku systemy rozpoznawania tekstu (OCR) nie są niestety dostosowane...
-
Contactless Hearing Aid for Infants Employing Signal Processing Algorithms. [Bezkontaktowy aparat słuchowy dla niemowląt wykorzystujący algorytmy przetwarzania sygnału]
PublicationZaprojektowany bezkontaktowy aparat słuchowy umiejscawiany jest w łóżeczku niemowlęcia. Aparat składający się z matrycy 4 mikrofonów oraz prototypowej karty z procesorem DSP pracuje w polu swobodnym. Przetworzony sygnał mowy emitowany jest z wykorzystaniem miniaturowych głośników. Opracowane algorytmy pozwalają na elminację akustycznych sprzężeń zwrotnych, które mogą wystepować ze względu na niewielką odległość mikrofonów od głośników...
-
Applications of knowledge technologies to sound and vision engineering
PublicationSpecjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...
-
Algorytmy genetyczne - sem. 2022/23
e-Learning CoursesGłównym celem przedmiotu jest zapoznanie studentów z algorytmami ewolucyjnymi. Wykład obejmuje następujące zagadnienia: ewolucyjne technik optymalizacji; kodowanie i dekodowanie parametrów; metody oceny stopnia przystosowania; metody selekcji osobników; operacje genetyczne; strategie podstawień; metody skalowania przystosowania; mechanizm niszowania; wielokryterialna optymalizacja.
-
Algorytmy genetyczne - sem. 2024/2025
e-Learning CoursesGłównym celem przedmiotu jest zapoznanie studentów z algorytmami ewolucyjnymi. Wykład obejmuje następujące zagadnienia: ewolucyjne technik optymalizacji; kodowanie i dekodowanie parametrów; metody oceny stopnia przystosowania; metody selekcji osobników; operacje genetyczne; strategie podstawień; metody skalowania przystosowania; mechanizm niszowania; wielokryterialna optymalizacja.
-
Algorytmy genetyczne - sem. 2023/2024
e-Learning CoursesGłównym celem przedmiotu jest zapoznanie studentów z algorytmami ewolucyjnymi. Wykład obejmuje następujące zagadnienia: ewolucyjne technik optymalizacji; kodowanie i dekodowanie parametrów; metody oceny stopnia przystosowania; metody selekcji osobników; operacje genetyczne; strategie podstawień; metody skalowania przystosowania; mechanizm niszowania; wielokryterialna optymalizacja.