Publications
Filters
total: 908
Catalog Publications
Year 2006
-
Musical instrument sound separation methods supported by artificial nueural network decision system
PublicationRozprawa doktorska (27 czerwica 2006).Celem prowadzonych prac badawczych było opracowanie algorytmów separacji dźwięków instrumentów muzycznych. Dodatkowo dobrano zestaw parametrów tak aby możliwe było wytrenowanie sztucznej sieci neuronowej w celu automatycznego rozpoznawania odseparowanych sygnałów. Zaproponowano również aby algorytm decyzyjny odpowiedzialny za klasyfikacje dźwięków pełnił funkcję automatycznej metody oceny algorytmów...
-
New digital aids for pateints after laryngectomy
PublicationPowrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej...
-
Pitch shifter with complex instantaneous frequency rescaling and direct digital synthesis
PublicationW artykule zaprezentowano nowy przesuwnik wysokości dźwięku ze skalowaniem częstotliwości chwilowej i z syntezą bezpośrednią. Jest on przeznaczony do komponowania melodii np. w telefonie komórkowym. Implementacja przesuwnika jest oparta na twierdzeniu Bedrosiana, zastosowanego do zespolonego odpowiednika hilbertowskiego przetwarzanego sygnału rzeczywistego. Filtr Hilberta pełni tu też dodatkową rolę. Jest nią filtracja antyaliasingowa....
-
Role of various parametres in automatic classification of musical instrument sound.
PublicationArtkuł dotyczy problemu automatycznej klasyfikacji dźwięków instrumentów muzycznych, w tym głównie wpływu indywidualnych parametrów na proces automatycznego rozpoznawania instrumentów. Parametryzacja wykorzystuje wdirmo Fourierowskie i analizę czasową dźwięków do formowania 14 i 62-parametrowych wektorów cech dystynktywnych. Autorzy porównują jakość rozpoznawania i rozróźnialność instrumentów. Przy ocenach tego typu stosowano drzewa...
-
Simulation of electric hearing - influence of simulation parameters on quality of output signal
PublicationW środowisku programistycznym Matlab stworzono symulację słuchu elektrycznego pacjenta implantowanego. W symulacji zastosowano algorytm przetwarzania wykorzystywany w komercyjnych systemach implantów ślimakowych - CIS (Continuous Interleaved Sampling). W pracy zbadano wpływ ilości kanałów, jak i innych parametrów sygnałów wyjściowych przy zastosowaniu sygału mowy jako sygnału wejściowego symulacji.
-
The Farrow structure for the Hilbert transform filter
PublicationPrzedstawiono nową implementację cyfrowego filtru Hilberta, wykonaną w strukturze Farrowa. Jest to filtr zespolony, realizujący jednocześnie dwie różne operacje liniowe, wykonywane dotychczas za pomocą osobnych filtrów. Pierwsza z nich polega na standardowej filtracji hilbertowskiej. Tworzy ona zespolony "analityczny" odpowiednik rzeczywistego sygnału wejściowego. Drugą, osiąganą za pomocą prze-próbkowania ze współczynnikiem, w...
-
Tinnitus diagnosis and therapy method employing ultrasound dithering.
PublicationZaproponowano interpretację sposobu powstawania szumów usznych w oparciu o teorię kwantyzacji sygnału. Przedstawiono stan prac nad urządzeniem ultradźwiękowym do maskowania szumów usznych, opartym na tej teorii.
-
Transient detection for speech coding applications
PublicationSignal quality in speech codecs may be improved by selecting transients from speech signal and encoding them using a suitable method. This paper presents an algorithm for transient detection in speech signal. This algorithm operates in several frequency bands. Transient detection functions are calculated from energy measured in short frames of the signal. The final selection of transient frames is based on results of detection...
-
Usuwanie niejednolitego tła z obrazów tekstu przy użyciu zmodyfikowanego algorytmu wyostrzania i filtracji nieliniowej
PublicationCelem referatu jest przedstawienie algorytmu poprawy jakości obrazów zawierających tekst na niejednolitym tle. Pierwsza faza realizacji algorytmu obejmuje usunięcie tła poprzez wykorzystanie zmodyfikowanej operacji wyostrzania, w której od oryginalnego obrazu odejmowany jest wynik filtracji dolnoprzepustowej. W tym celu zaproponowano metodę wyznaczenia optymalnej wielkości maski filtru dolnoprzepustowego. W drugiej fazie działania...
-
Vowel recognition based on acoustic and visual features
PublicationW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...
-
Waveguide model of the hearing aid earmold system
PublicationBackground The earmold system of the Behind-The-Ear hearing aid is an acoustic system that modifies the spectrum of the propagated sound waves. Improper selection of the earmold system may result in deterioration of sound quality and speech intelligibility. Computer modeling methods may be useful in the process of hearing aid fitting, allowing physician to examine various earmold system configurations and choose the optimum one...
-
Waveguide model of the hearing aid earmold system
PublicationBackground The earmold system of the Behind-The-Ear hearing aid is an acoustic system that modifies the spectrum of the propagated sound waves. Improper selection of the earmold system may result in deterioration of sound quality and speech intelligibility. Computer modeling methods may be useful in the process of hearing aid fitting, allowing physician to examine various earmold system configurations and choose the optimum one...
-
Wow defect reduction based on interpolation techniques
PublicationW artykule przedstawiono wyniki badania różnych technik interpolacji wykorzystanych w redukcji kołysania dźwięku. W badaniach użyto: interpolację liniową, techniki interpolacji wielomianowej, i interpolację funkcją sink. Jakość rekonstrukcji zbadano wykorzystując sztucznie spreparowany sygnał foniczny, zrekonstruowany wymienionymi metodami interpolacji. Jakość rekonstrukcji oceniono wykorzystując standardowe deskryptory jakości...
-
Wykorzystanie nowych metod wnioskowania w grafice i animacji komputerowej
PublicationReferat opisuje realizowane zadania badawcze, dotyczące wykorzystana nowych metod wnioskowania (tzw. soft-computingu) w przetwarzaniu grafiki i animacji komputerowej. W pierwszym z zadań, opracowaniu metody poprawy jakości fotografii tekstu przeznaczonych do rozpoznawania znaków, wykorzystano algorytmy przetwarzania obrazów i ich modyfikacje do usuwania ze zdjęcia tła oraz gradientu jasności, następnie nowa metoda filtracji nieliniowej...
-
Zastosowanie przetwarzania rozmytego w animacji komputerowej
PublicationReferat przedstawia projekt systemu ekspertowego do tworzenia animacji komputerowych. Założono, iż wykorzystanie reguł animacji tradycyjnej i przetwarzania rozmytego może przyspieszyć proces tworzenia animacji komputerowych i pozwoli uzyskiwać animacje o wysokiej jakości wizualnej, nie ustępujące anima-cjom przygotowanym w całości przez animatora. Wejściem do systemu jest prosta animacja oraz opis ruchu pożądanego przez użytkownika....
Year 2005
-
Akustyka sali widowiskowej z zainstalowanym systemem elektroakustycznym
PublicationW referacie przedstawiono i omówiono wyniki pomiarów podstawowych parametrów akustycznych sali widowiskowej w Domu Kultury. Sala, w obrysie prostokątna, posiada 250 miejsc. W szczególności skonfrontowano wyniki pomiarów uzyskane przy pobudzeniu poprzez zainstalowany w niej system system elektroakustyczny z wynikami uzyskanymi przy klasycznej metodzie z pobudzeniem pojedynczym źródłem impulsu - strzałami z pistoletu startowego....
-
Analysis and generation of emotionally-charged animated gesticulation
PublicationPrzygotowano animacje komputerowe, przedstawiające gestykulację nacechowaną emocjonalnie. Wykorzystano metodę animacji z klatkami kluczowymi. Zaproponowano zestaw parametrów opisujących ruch, które sprawdzono pod kątem przydatności w klasyfikacji treści emocjonalnych w animacji. Wykorzystano metody analizy zbiorów przybliżonych. Przedstawiono możliwość wykorzystania wyników w generowaniu animacji o pożądanych cechach emocjonalnych....
-
Automatic evaluation of sound separation quality
PublicationW publikacji tej opisano problem oceny efektywności algorytmów separacji dźwięków muzycznych. Standardowa procedure służąca do takiej oceny nie istnieje. Najbardziej uzasadnionym podejściem wydają się być odsłuchowe testy subiektywne. Niemniej, aby taka ocena była wartościowa, niezbędna jest porządna walidacja statystyczna wyników, co oznacza iż grupa ekspertów powinna być duża oraz właściwości akustyczne pomieszczenia. Ponadto...
-
Estimation of musical sound separation algorithm effectiveness employing neural networks.
PublicationŚlepa separacja dźwięków sygnałów muzycznych zawartych w zmiksowanym materiale jest trudnym zadaniem. Jest to spowodowane tym, że dźwięki znajdujące się w relacjach harmonicznych mogą zawierać kolidujące składowe sinusoidalne (składowe harmoniczne). Ewaluacja wyników separacji jest również problematyczna, gdyż analiza błędu energetycznego często nie odzwierciedla subiektywnej jakości odseparowanych sygnałów. W tej publikacji zostały...
-
Komputerowe modelowanie dźwiękowodu aparatu słuchowego
PublicationW artykule opisano metodę komputerowego modelowania dźwiękowodu aparatu słuchowego. Model opracowany został z wykorzystaniem metody falowodowej. Symulacje komputerowe umożliwiają zbadanie właściwości akustycznych dźwiękowodów o różnych parametrach. Opisany model może zostać zastosowany w systemie dopasowywania aparatu słuchowego do potrzeb jego użytkownika, w celu zminimalizowania zniekształceń dźwięku wprowadzanych przez dźwiękowód...
-
System rozpoznawania mowy wykorzystujący cechy wizualne
PublicationNiniejszy artykuł przedstawia metodę rozpoznawania głosek na podstawie analizy ruchu ust, która może znaleźć zastosowanie w terapii logopedycznej osób z wadami słuchu. W pracy opisano algorytm wyznaczana i śledzenia położenia ust oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. Dodatkowo przeprowadzono...
Year 2004
-
Comparison of effectiveness of musical sound separation algorithms employing neural networks.
PublicationNiniejszy referat przedstawia kilka algorytmów służących do separacji dźwięków instrumentów muzycznych. Zaproponowane podejście do dekompozycji miksów dźwiękowych opiera się na założeniu, że wysokość dźwięków w miksie jest znana, tzn. wejściem dla algorytmów jest przebieg zmian wysokości dźwięków składowych miksu. Proces estymacji fazy i amplitudy składowych harmonicznych wykorzystuje dopasowywanie zespolonych przebiegów harmonicznych...
-
Processing of musical data employing rough sets and artificial neural networks
PublicationArtykuł opisuje założenia systemu automatycznej identyfikacji muzyki i dźwięków muzycznych. Dokonano przeglądu standardu MPEG-7, ze szczególnym naciskiem na parametry opisowe dźwięku. Przedyskutowano problemy analizy danych audio, związane z zastosowaniami wykorzystującymi MPEG-7. W oparciu o eksperymenty przedstawiono efektywność deskryptorów niskiego poziomu w automatycznym rozpoznawaniu dźwięków instrumentów muzycznych. Przedyskutowano...
Year 2003
-
Automatic assessment of the hearing aid dynamics based on fuzzy logic
PublicationPrzedstawiono podstawy koncepcyjne systemu dopasowania protez słuchu opartego na logice rozmytej. Przeprowadzono dyskusje na temat metody skalowania głośności. Następnie podano szczegóły procesu aproksymacji funkcji przynależności odzwierciedlające słuchowe wrażenia głośności. Załączono wnioski.
-
"Computing with word" concept applied to musical information retrieval
PublicationW artykule zaproponowano wykorzystanie koncepcji "przetwarzania słów języka naturalnego" do znalezienia związku pomiędzy wybranymi parametrami dźwięków muzycznych a subiektywnie postrzeganą barwą. W pierwszej kolejności przedstawiono klasyczne metody mapowania parametrów mierzalnych i ich subiektywnych odpowiedników, następnie zbudowano bazę wiedzy w oparciu o wyniki testów subiektywnych. W procesie obróbki wykorzystano metodę...
-
"Computing with words" concept applied to musical information retrieval
PublicationW artykule zaproponowano wykorzystanie koncepcji "przetwarzania słów języka naturalnego" do znalezienia związku pomiędzy wybranymi parametrami dźwięków muzycznych a subiektywnie postrzeganą barwą. W pierwszej kolejności przedstawiono klasyczne metody mapowania parametrów mierzalnych i ich subiektywnych odpowiedników, następnie zbudowano bazę wiedzy w oparciu o wyniki testów subiektywnych. W procesie obróbki wykorzystano metodę...
-
Dekompozycja sygnału muzycznego na składowe harmoniczne i nieharmoniczne przy wykorzystaniu metody FED
Publication.
-
Diagnostyka słuchu i zagrożeń hałasowych
PublicationW pierwszej części referatu przedstawiono przesiewową metodę diagnostyki słuchu. Szczegółowo opisano różne rodzaje testów przesiewowych. Zamieszczono dyskusję zastosowanej audiometrii mowy w słuchu. W drugiej części przedstawiono aktualnie opracowywany system zdalnego monitorowania zagrożeń hałasowych. Oprócz ogólnej charakterystyki systemu przedstawiono szczegółowy opis jego poszczególnych elementów składowych.
-
Extraction of music information based on artifical neutral networks
PublicationW artykule przedstawiono założenia systemu automatycznego rozpoznawania muzyki. Na podstawie przeprowadzonych eksperymentów w artykule przedstawiono efektywność zaimplementowanych algorytmów w zależności od sposobu opisu danych muzycznych. Zaimpementowany system jest oparty o sztuczne sieci neuronowe.
-
Intelligent processing of stuttered speech.
PublicationW artykule zaprezentowano kilka metod analizy i automatycznego zliczania potknięć artykulacyjnych, związanych z jąkaniem się, opartych na wykorzystaniu algorytmów uczących się sztucznych sieci neuronowych i zbiorów przybliżonych.
-
Introduction to the special issue on intelligent systems to aid the handicapped.
PublicationWśród wielu zastosowań sztucznej inteligencji i technologii bazodanowych pojawiają się zastosowania wspierające osoby niepełnosprawne. Z chwilą pojawienia są każdej nowej technologii komputerowej świat naukowy proponuje zastosowania tej technologii do celu poprawy komunikacji z osobami niepełnosprawnymi bądź technologie wspierające te osoby bezpośrednio. Niniejsze wydanie specjalne czasopisma Journal of Intelligent Information...
-
J-lossless and extended J-lossless factorisations approach for delta do main Hinf control.
Publication.
-
Komputerowy program do analizy hałasu
PublicationW pracy przedstawiono założenia i wyniki opracowywanej aplikacji do pomiaru i analizy poziomu hałasu, będącego częścią konstruowanego ogólnopolskiego systemu telemonitoringu hałasu. Opracowano graficzny sposób prezentacji wyników pomiaru. W pracy zawarto opis wybranych algorytmów obliczeniowych zastosowanych w programie, przedstawiono analizę porównawczą otrzymanych wyników pomiarów z wykorzystaniem opracowanego programu.
-
Metoda oceny skuteczności cyfrowego korektora mowy
PublicationCyfrowy korektor mowy, który został opracowany w Katedrze Inżynierii Dźwięku i Obrazu PG, jest urządzeniem pozwalającym na poprawę płynności mowy osób jąkających się z wykorzystaniem nowego typu metodykę modyfikacji audytoryjnej pętli sprzężenia zwrotnego. W niniejszej pracy zawarto podstawowe informacje na temat wady wymowy, jaką jest jąkanie się oraz na temat opracowanego korektora.
-
Metodyka oceny skuteczności cyfrowego korektora mowy
PublicationW pracy zawarto podstawowe informacje na temat jąkania i zasad działania korektora. Skupiono się na zagadnieniu oceny postępów w terapii z wykorzystaniem ankiet i tzw. próby sylabowej. Zawarto również wyniki wstępnych analiz materiałów przesyłanych z poradni. Ponadto opisano krótko algorytmy które posłużą do automatycznej detekcji zaburzeń mowy.
-
Multimedialny system wyszukiwania informacji muzycznej w internecie
PublicationCelem referatu jest przedstawienie założeń sieciowej implementacji multimedialnego systemu rozpoznawania informacji muzycznej. Przedyskutowana zostanie skuteczność zimplementowanego algorytmu detekcji częstotliwości podstawowej dźwięków muzycznych. Zostaną zawarte również wyniki eksperymentów związanych z badaniem wpływu opisu reprezentacji sygnałowej na skuteczność identyfikacji instrumentów muzycznych.
-
Obiektywna metoda wyznaczania skuteczności systemów implantów ślimakowych
PublicationPrzedmiotem pracy było opracowanie nowej metody wyznaczania skuteczności systemów implantów ślimakowych opartej o komputerowe symulacje słyszenia elektrycznego.
-
Rough set based automatic classification of musical instrument sound
PublicationReferat dotyczy problemu automatycznego rozpoznawania instrumentów muzycznych rozwiązywanego z zastosowaniem, inteligentnych algorytmów decyzyjnych. Wnioski zawarte w referacie dotyczą reprezentacji sygnałów muzycznych, która jest przydatna w procesie automatycznej klasyfikacji instrumentów.
-
System synchronizacji nagrań wielokanałowych
PublicationNiniejsza praca zawiera opis komputerowego systemu synchronizacji wielu dźwięków pochodzących z nagrania jednej wypowiedzi przy wykorzystaniu kilku mikrofonów i różnych niezsynchronizowanych urządzeń rejestrujących. System wykorzystuje korelację skrośną.
-
Technika wirtualizacji dźwięku wykorzystująca odpowiedzi impulsowe zarejestrowane za pomocą sztucznej głowy w komorze bezdechowej
PublicationPrzedstawiono opracowany w Katedrze Systemów Multimedialnych WETI PG, komputerowy system przetwarzania sygnałów. Zadaniem systemu jest prawidłowe umieszczenie wirtualnego źródła dźwięku w panoramie dookólnej. W ostatniej części pracy pokazano uzyskane wyniki testów dokładności lokalizacji wirtualnych źródeł dźwięku.
-
Weryfikacja systemu dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie
PublicationWiększość systemów dopasowania protez słuchu koncentruje się na poprawie zrozumiałości mowy. Problem dopasowania protez słuchu może w uproszczeniu być przedstawiony jako problem dopasowania szerokiej dynamiki sygnału mowy do zawężonej dynamiki uszkodzonego słuchu. Głównym celem badań było przetestowanie opracowanego systemu oraz sprawdzenie w jakim stopniu zaimplementowany moduł wirtualnej protezy słuchu może poprawić zrozumiałość...
-
Zastosowanie inżynierii dźwięku i obrazu w medycynie
PublicationWynikiem opracowań Katedry Systemów Multimedialnych PG we współpracy z Instytutem Fizjologii i Patologii Słuchu w Warszawie jest zestaw narzędzi komputerowych do badania słuchu oraz rozwiązanie systemowe masowych badań przesiewowych słuchu, mowy i wzroku oparte na zastosowaniu współczesnych technologii teleinformatycznych. Niektóre wdrożone aplikacje i systemy z dziedziny diagnostyki słuchu, mające w znacznej mierze charakter oryginalny,...
-
Zastosowanie technologii teleinformatycznych do powszechnej diagnostyki zagrożeń hałasem
PublicationCelem projektu realizowanego przez Katedrę Inżynierii Dźwięku i Obrazu PG jest zmniejszenie częstości występowania chorób słuchu powodowanych nadmiernym hałasem i innego rodzaju niepożądanymi dźwiękami w życiu codziennym. W toku realizacji projektu zostaną wykorzystane najnowsze osiągnięcia technologiczne z dziedziny teleinformatyki.
Year 2002
-
Applications of neural networks and perceptual masking to audio restoration
PublicationOmówiono zastosowania algorytmów uczących się w dziedzinie rekonstruowania nagrań fonicznych. Szczególną uwagę zwrócono na zastosowanie sztucznych sieci neuronowych do usuwania zakłócających impulsów. Ponadto opisano zastosowanie inteligentnego algorytmu decyzyjnego do sterowania maskowaniem perceptualnym w celu redukowania szumu.
-
Comparing some convolution-based methods for creation of surround sound
PublicationW referacie przedstawiono eksperymenty związane z symulacją dźwięku dookólnego w sali koncertowej. W tym celu wykorzystano splot odpowiedzi impulsowej z danego wnętrza (wielokanałowe nagrania odpowiedzi impulsowej) z nagraniami z komory bezechowej. Uzyskany w ten sposób sygnał został następnie przypisany do odpowiednich kanałów w systemie dookólnym. Uzyskane w ten sposób nagrania były następnie porównywane w testach subiektywnych...
-
Digital waveguide models of the panpipes
PublicationW artykule przedstawiono główne cechy syntezy falowodowej. Omówiono cechy instrumentu fletni Pana. Przedyskutowano cechy zaproponowanych dwóch modeli fletni Pana różniących się złożonością obliczeniową. Pokazano szczegóły implementacyjne tych modeli, a także uzyskane wyniki symulacji dźwięków w modelach. Dokonano porównania dźwięków rzeczywistych i uzyskanych w wyniku syntezy falowodowej.
-
Estymacja częstotliwości podstawowej sygnałów muzycznych w środowisku Matlab
PublicationEstymacja częstotliwości podstawowej dźwięków wydaje się stosunkowo mało złożonym zagadnieniem z dziedziny cyfrowego przetwarzania sygnałów, niemniej jednak w celu uniknięcia dość licznie występujących w praktyce błędów estymacji konieczne jest stosowanie wiedzy o charakterystyce analizowanych sygnałów i o zakresie występowania dopuszczalnych częstotliwości. W referacie zaprezentowano praktyczne aspekty implementacji algorytmu...
-
Expert media approach to hearing aids fitting
PublicationW artykule zaprezentowano problematykę dopasowania protez słuchu. Przedstawiono system ekspercki, który pozwala na znalezienie charakterystyk aparatu słuchowego adekwatnego do uszkodzenia słuchu. System został oparty o metodę zbiorów przybliżonych i logikę rozmytą.
-
Filtr cyfrowy o zmiennym opóźnieniu ułamkowym
PublicationW artykule rozważono problem projektowania szerokopasmowego filtru cyfrowego o zmiennym opóźnieniu ułamkowym. Filtr ten przeznaczony jest do zmiany szybkości próbkowania sygnału dyskretnego jako interfejs umożliwiający współpracę systemów cyfrowych, np. akustycznych lub wizyjnych, o różnych standardach szybkości próbkowania. Wówczas filtr o zmiennym opóźnieniu.
-
Interaktywne badania słuchu, wzroku i mowy
PublicationTelemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.