Filters
total: 2815
filtered: 528
-
Catalog
- Publications 528 available results
- People 25 available results
- Inventions 7 available results
- Projects 5 available results
- Laboratories 1 available results
- Research Teams 2 available results
- Research Equipment 2 available results
- e-Learning Courses 62 available results
- Events 6 available results
- Open Research Data 2177 available results
Chosen catalog filters
Search results for: ROZPOZNAWANIE DŹWIĘKÓW
-
Vowel recognition based on acoustic and visual features
PublicationW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...
-
Eksperymentalna weryfikacja przydatności wybranych parametrów standardu MPEG-7 w procesie klasyfikacji dźwięków instrumentów muzycznych
PublicationObecnie stosowane metody wyszukiwania informacji muzycznej w internecie bazują na parametrycznym opisie zawartości danych multimedialnych. W standardzie MPEG-7 w części dotyczącej sygnałów fonicznych zawarto opis oparty w dużej mierze o analizę widmową, przy czym dla dźwięków muzycznych parametryzowane jest widmo FFT fragmentu stanu quasi-ustalonego.
-
Pomiary współczynnika pochłaniania dźwięku ławek kościelnych
PublicationPo wykończeniu wnętrza kościoła p. w. św. Michała zmierzono czas pogłosu. Jako kroki zaradcze przeciw nadmiernej pogłosowości zastosowano specjalnie w tym celu zaprojektowane, ławki kościelne pochłaniające dźwięk. Zarejestrowano znaczące skrócenie czasu pogłosu wnętrza w szerokim zakresie częstotliwości dzięki zastosowaniu ustrojów. Oszacowano współczynnik pochłaniania dźwięku ławek w oparciu o pomiary czasu pogłosu pomieszczenia.
-
Algorytm automatycznego rozpoznawania treści tablicy rejestracyjnej i wyszukiwania pojazdów w bazie danych
PublicationReferat opisuje algorytm rozpoznawania znaków zawartych w tablicy rejestracyjnej oraz współpracę algorytmu z bazą danych tablic rejestracyjnych. Przedstawiono metodę rozpoznawania znaków wykorzystującą obraz ze zlokalizowaną wcześniej tablicą rejestracyjną. Obraz tablicy jest poddawany przetwarzaniu wstępnemu. Wykonywane są operacje automatycznego wykrywania rotacji tablicy, normalizowania histogramu, dostosowania współczynnika...
-
Od dźwięku do słowa i jeszcze dalej – aż do analizy homomorficznej i z powrotem do dźwięku
Publication -
Rozpoznawanie ruchu rąk oraz chodu pacjentów na podstawie analizy sygnałów pochodzących z trójosiowych czujników przyspieszenia
PublicationW pracy przedstawiono eksperymenty związane z automatyczną klasyfikacją i rozpoznawaniem aktywności pacjentów z chorobą Parkinsona. W szczególności opisano algorytmy, mające na celu rozpoznawanie dwóch kategorii ruchu: ruchu rąk oraz chodu. Aktywności te wykrywane są na podstawie analizy sygnałów pochodzących z trójosiowych akcelerometrów umieszczonych na ciele osoby badanej.
-
Perception-based data processing in acoustics. Applications to music information retrieval and psychophysiology of hearing.
PublicationTematyka książki obejmuje w pierwszej kolejności opis mechanizmów kognitywnych leżących u podstaw percepcji muzyki. Przedstawione zostały również zagadnienia automatycznego rozpoznawania dźwięków instrumentów muzycznych i muzyki, zastosowanie nowych metod z dziedziny sztucznej inteligencji w szeroko rozumianej inżynierii dźwięku oraz komputerowych metod badania słuchu.
-
Ocena skuteczności wybranych metod klasyfikacji statycznych i dynamicznych gestów rąk
PublicationW artykule przedstawiono porównanie technik sztucznej inteligencji w aspekcie rozpoznawania statycznych i dynamicznych gestów rąk. Jako urządzenie wejściowe posłużyła bezprzewodowa elektroniczna rękawica e-Glove. Gesty rozpoznawane są w procesie analizy wartości sygnałów pochodzących z magnetometru i akcelerometrów trójosiowych. W referacie przedstawiono porównanie skuteczności wybranych technik zastosowanych w rozpoznawaniu gestów...
-
Gazetteer compression technique based on substructure recognition
PublicationAutomaty skończone są najlepszą formą reprezentacji słowników do przetwarzania języka naturalnego. Przedstawiamy nową technikę kompresji, która jest szczególnie użyteczna w stosunku do pewnego rodzaju słowników. Zastępujemy wielokrotnie występujące podstruktury ich niepowtarzalnymi reprezentantami. Do ich znalezienia traktujemy wektor przejść jako tekst i stosujemy technikę kompresji tekstu w stylu Ziv-Lempel, która znajduje powtórzenia...
-
Wykorzystanie sztucznych sieci neuronowych do wykrywania i rozpoznawania tablic rejestracyjnych na zdjęciach pojazdów
PublicationW artykule przedstawiono koncepcję algorytmu wykrywania i rozpoznawania tablic rejestracyjnych (AWiRTR) na obrazach cyfrowych pojazdów. Detekcja i lokalizacja tablic rejestracyjnych oraz wyodrębnienie z obrazu tablicy rejestracyjnej poszczególnych znaków odbywa się z wykorzystaniem podstawowych technik przetwarzania obrazu (przekształcenia morfologiczne, wykrywanie krawędzi) jak i podstawowych danych statystycznych obiektów wykrytych...
-
Wdrażanie tradycyjnego wzornictwa jako sposób rozpoznawania nowozasiedlanych miejsc i aktywizacji małych społeczności lokalnych
PublicationKoncepcją dla reaktywacji społeczności wiejskich lub nowopowstających społeczności osób zamieszkujących stale lub czasowo na obszarach podmiejskich jest zainteresowanie ich miejscem zasiedlenia z perspektywy jego historii i walorów przyrodniczo-kulturowych. Zrozumienie lokalnych uwarunkowań jest punktem wyjścia dla zbudowania pozytywnych relacji społecznych. Jednym z aspektów takich uwarunkowań są tradycje wzorniczo – budowalne...
-
Badanie rozpoznawania twarzy przez człowieka z wykorzystaniem systemu śledzenia fiksacji wzroku Cyber-Oko
PublicationW celu dokładniejszego zrozumienia sposobu rozpoznawania i zapamiętywania twarzy przez człowieka przeprowadzono doświadczenie na grupie 20 osób z wykorzystaniem wcześniej opracowanego systemu śledzenia fiksacji wzroku Cyber-Oko. Wykorzystując diody i kamerę podczerwieni wraz z dedykowanym oprogramowaniem Cyber-Oko, które pozwala na śledzenie punktu skupienia wzroku na ekranie. Każdej osobie biorącej udział w doświadczeniu pokazano...
-
Obiekty handlu targowego w przestrzeni publicznej Gdańska - rozpoznanie problemu badawczego
PublicationPrzestrzeń publiczna w swojej historii jak i współcześnie wciąż jest wykorzystywana do funkcji handlowej, stąd zagadnienie handlu targowego w przestrzeni publicznej, nie jest bez znaczenie pod względem wpływów na kształtowanie danego miejsca. Podejście naukowe do form obiektów związanych z handlem targowym za równo w ujęciu historycznym jak i współczesnym, pozwoli usystematyzować jego funkcjonowanie we współczesnym mieście.
-
Obiekty handlu targowego w przestrzeni publicznej Gdańska - Rozpoznanie problemu badawczego
PublicationRozpoznanie miejsc związanych z handlem targowym wpływających na kształtowanie się struktury miast. Rola handlu targowego jako elementu kształtującego przestrzeń publiczną.
-
XVIII Międzynarodowe Sympozjum Inżynierii i Reżyserii Dźwięku
PublicationThe subjective assessment of speech signals takes into account previous experiences and habits of an individual. Since the perception process deteriorates with age, differences should be noticeable among people from dissimilar age groups. In this work, we investigated the difference of speech quality assessment between high school students and university students. The study involved 60 participants, with 30 people in both the adolescents...
-
Zastosowanie inżynierii dźwięku i obrazu w medycynie
PublicationWynikiem opracowań Katedry Systemów Multimedialnych PG we współpracy z Instytutem Fizjologii i Patologii Słuchu w Warszawie jest zestaw narzędzi komputerowych do badania słuchu oraz rozwiązanie systemowe masowych badań przesiewowych słuchu, mowy i wzroku oparte na zastosowaniu współczesnych technologii teleinformatycznych. Niektóre wdrożone aplikacje i systemy z dziedziny diagnostyki słuchu, mające w znacznej mierze charakter oryginalny,...
-
Wstępne przetwarzanie dźwięku przeznaczonego do odsłuchu wielokanałowego.
PublicationW pracy opisano opracowane metody wstępnego przetwarzania plików dźwiękowych przeznaczonych do odsłuchu w systemie wielokanałowym. Umożliwiają one synchronizację i normalizację głośności. Normalizacja uwzględnia wpływ położenia głośników w panoramie odsłuchowej. Opis metod poprzedza krótka analiza głównych mechanizmów odpowiedzial-nych za lokalizację dźwięku przez człowieka.
-
Bezprzewodowy moduł detekcji źródeł dźwięku – system klasyfikatorów
PublicationMonitoring bezpieczeństwa osób starszych i chorych przebywających samotnie w pomieszczeniach można realizowaćpoprzez detekcję dźwięków nietypowych. W tym celu zbudowano moduł nasłuchujący, który analizuje dźwięki z otoczenia. Oblicza on szereg parametrów dźwięku, także bazujących na STFT i MFCC. Umożliwiają one wychwycenie i sklasyfikowanie takich odgłosów jak jęki, krzyki, kaszel oraz huki. Przedstawiono...
-
Zastosowanie sieci neuronowych w cyfrowej syntezie dźwięku
PublicationRozwój technik związanych z uczeniem maszynowym umożliwia nowe podejście i nowe definiowanie wielu dotychczasowych problemów. Heurystyczne algorytmy stosowane do problemów takich jak klasyfikacja danych w postaci wektorów cech, czy wyróżnianie grup obiektów o podobnych własnościach mogą znaleźć także zastosowanie w takich dziedzinach jak analiza i synteza dźwięków muzycznych. W referacie przybliżone zostały podstawowe zasady projektowania...
-
Audiovisual speech recognition for training hearing impaired patients
PublicationPraca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...
-
Rozpoznanie geotechniczne podłoża gruntowego metodą CPTU skarpy Zamku Królewskiego w Warszawie
PublicationW artykule przedstawiono skrócony opis badań podłoża gruntowego skarpy przy ul. Steinkellera w Warszawie. Problem rozpoznania geotechnicznego tego terenu jest istotny co najmniej z trzech powodów: teren skomplikowany pod względem budowy (uwzględniając historyczną ingerencję w tym działania wojenne, wysypisko odpadów …), lokalizacja kompleksu Zamku Królewskiego w Warszawie oraz aktywność skarpy, w postaci powolnego płynięcia. W...
-
Od dźwięku do słowa i jeszcze dalej (książka)
Publication -
PRZEGLĄD METOD PRZETWARZANIA DŹWIĘKU WYKORZYSTYWANYCH W APARATACH SŁUCHOWYCH
PublicationNiniejszy artykuł odnosi się do aktualnego stanu technologii wykorzystywanych w cyfrowych aparatach słuchowych, ze szczególnym uwzględnieniem technik cyfrowego przetwarzania sygnałów dźwiękowych. W artykule przedstawiono czynniki mające wpływ na efektywność aparatów słuchowych, a także zaprezentowano przykłady nowoczesnych metod cyfrowego przetwarzania sygnałów. Przedstawiono również przykłady ograniczeń współczesnych aparatów...
-
Algorytm normalizacji poziomów głośności dźwięku zarejestrowanego w plikach.
PublicationW pracy przedstawiono algorytm normalizacji głośności plików dźwiękowych dedykowany głośnikowemu odsłuchowi wielokanałowemu. Algorytm generuje wartości wzmocnień potrzebne do ujednolicenia głośności plików dźwiękowych. Są one uzyskiwane na podstawie normalizacji wartości skutecznej, odpowiednio przefiltrowanych plików dźwiękowych. W celu wyeliminowania ewentualnych przesterowań, po wykonanej normalizacji wartości skutecznej, następuje...
-
Badanie wierności brzmienia dźwięku instrumentów wirtualnych VST/TRTAS
PublicationTematem referatu jest subiektywne badanie wierności brzmienia instrumentów wirtualnych (VST/TRTAS) wykorzystujących próbkowanie dźwięków rzeczywistych instrumentów muzycznych. Na potrzeby przedstawionej pracy wybrano kilka utworów muzyki orkiestrowej z epoki romantyzmu i klasycyzmu, nagranych przy użyciu instrumentów akustycznych. Następnie zaaranżowano fragmenty tych utworów, wykorzystując do tego instrumenty wirtualne i efekty...
-
Testing a Variety of Features for Music Mood Recognition. Testowanie zestawu parametrów w celu rozpoznawania nastroju w muzyce
PublicationMusic collections are organized in a very different way depending on a target, number of songs or a distribution method, etc. One of the high-level feature, which can be useful and intuitive for listeners, is “mood”. Even if it seems to be the easiest way to describe music for people who are non-experts, it is very difficult to find the exact correlation between physical features and perceived impressions. The paper presents experiments...
-
REJESTRACJA SERII ZDJĘĆ, Z WYMUSZENIEM ZMIENNYCH WARUNKÓW OŚWIETLENIOWYCH, JAKO TECHNIKI WSPOMAGAJĄCEJ PRZY AUTOMATYCZNYM ROZPOZNAWANIU TEKSTU
PublicationW artykule przedstawiono autorskie rozwiązania problemu wykonywania zdjęć niewyraźnych tekstów na opakowaniach i niewielkich produktach. W sytuacji gdy napis posiada niską rozdzielczość (drukarka atramentowa), albo jest wykonany poprzez technikę tłoczenia, wykonanie zwykłego, pojedynczego zdjęcia daje przeważnie niezadowalające wyniki. Dzięki przedstawionym tu rozwiązaniom, znacząco polepszamy materiał wejściowy (fotografie), który...
-
Automatic Singing Voice Recognition EmployingNeural Networks and Rough Sets
PublicationCelem badań jest automatyczne rozpoznawanie głosów śpiewaczych w kategorii rodzaju i jakości technicznej śpiewu. W artykule opisano stworzoną bazę danych głosów, która zawiera próbki głosu śpiewaków profesjonalnych i amatorskich. W dalszej części opisano parametry zdefiniowane w oparciu o zjawiska biomechaniczne w narządzie głosu podczas śpiewania. W oparciu o stworzone macierze parametrów wytrenowano i porównano automatyczne klasyfikatory...
-
Rozpoznanie ról użytkowników usługi e-mail z wykorzystaniem metody opartej na ontologii
PublicationSieci społeczne jako struktury ukazujące społeczne powiązania pomiędzy osobami lub całymi organizacjami poddawane są często analizie w celu rozpoznania ról, jakie pełnią poszczególni aktorzy w danej sieci. Taka klasyfikacja ról odgrywanych przez aktorów może dostarczać wielu cennych informacji o danej sieci, gdyż daje nam całościowy obraz danej sieci pozwalając na zrozumienie, w jaki sposób sieć jest zorganizowana, i w jaki sposób...
-
Prawidłowe rozpoznanie toksoplazmozy u kobiet ciężarnych - ważność badań diagnostycznych oraz nowe możliwości
PublicationArtykuł opisuje problem toksoplazmozy, kliniczne objawy choroby, leczenie, aktualną diagnostykę oraz nowe możliwości testów diagnostycznych. Ponadto, przedstawiono istotne zagadnienia obejmujące aktualnie prowadzone badania naukowe, które dotyczą zastosowania nowych narzędzi diagnostycznych (rekombinantowych antygenów T. gondii) w serodiagnostyce toksoplazmozy.
-
Applications of computational intelligence techqniues to acoustics
PublicationCelem artykułu jest przegląd wybranych zastosowań metod inteligentnych w akustyce, a w szczególności w szeroko rozumianej inżynierii dźwięku. Przedstawione badania i eksperymenty były prowadzone w oparciu o sztuczne sieci neuronowe, metodę zbiorów przybliżonych, logiką rozmytą, grafy przepływowe Pawlaka oraz algorytmy genetyczne. Rozwiązywane problemy dotyczyły klasyfikacji dźwięków muzycznych, rozpoznawania fraz muzycznych, przetwarzania...
-
Poszukiwanie korelacji pomiędzy parametrami wektora cech i barwą dźwięku
PublicationPrzedstawiono algorytm poszukiwania korelacji między wartościami parametrów dźwięku a jego barwą. Wykonywana jest analiza statystyczna wartości przyjmowanych przez parametry, następnie w oparciu o logikę rozmytą, dyskretyzacja.Zadaniem ekspertów w teście odsłuchowym jest dopasowanie określenia semantycznego do prezentowanych dźwięków. Następny etap to wydobycie reguł w oparciu o metodę zbiorów przybliżonych. Do tego celu wykorzystywany...
-
SYMULACJA DŹWIĘKU PRZESTRZENNEGO W ŚCIEŻCE DŹWIĘKOWEJ W ODSŁUCHU BINAURALNYM
PublicationCelem pracy jest przedstawienie aplikacji umożliwiającej tworzenie stereofonicznej ścieżki dźwiękowej do filmu, symulującej dźwięk przestrzenny w odsłuchu słuchawkowym. Interfejs przygotowanej aplikacji pozwala użytkownikowi na wybór rozmieszczenia konkretnych partii instrumentalnych w odpowiednich miejscach w przestrzeni dźwiękowej oraz jednoczesny odsłuch wszystkich ścieżek wraz z przygotowanym materiałem filmowym. Symulacja...
-
Musical Instrument Separation Applied to Music Genre Classification . Separacja instrumentów muzycznych w zastosowaniu do rozpoznawania gatunków muzycznych
PublicationThis paper outlines first issues related to music genre classification and a short description of algorithms used for musical instrument separation. Also, the paper presents proposed optimization of the feature vectors used for music genre recognition. Then, the ability of decision algorithms to properly recognize music genres is discussed based on two databases. In addition, results are cited for another database with regard to...
-
Awidność przeciwciał IgG jako ważny test diagnostyczny w rozpoznawaniu aktywnej toksoplazmozy - stan obecny i nowe możliwości.
PublicationW artykule opisano problem diagnostyki toksoplazmozy ze szczególnym uwzględnieniem metody awidności przeciwciał klasy IgG. Test oznaczania awidności przeciwciał IgG swoistych dla T. gondii jest użytecznym wskaźnikiem serologicznym toksoplazmozy, który w wielu przypadkach na podstawie pojedynczego badania surowicy pacjenta pozwala potwierdzić lub wykluczyć aktywną postać choroby. W pierwotnej, aktywnej toksoplazmozie przeciwciała...
-
Automatic singing voice recognition employing neural networks and rough sets
PublicationCelem prac opisanych w referacie jest automatyczne rozpoznawanie głosów śpiewaczych. Do tego celu utworzona została baza nagrań próbek śpiewu profesjonalnego i amatorskiego. Próbki poddane zostały parametryzacji parametrami zaproponowanymi przez autorów ściśle do tego celu. Sposób wyznaczenia parametrów i ich interpretacja fizyczna przedstawione są w referacie. Parametry wprowadzane są do systemów decyzyjnych, klasyfikatorów opartych...
-
Dopasowanie charakterystyki dynamiki dźwięku do preferencji słuchowych użytkownika urządzeń mobilnych
PublicationW celu określenia preferowanej charakterystyki dynamiki generowanych dźwięków należy uzyskać informację, w jaki sposób użytkownik postrzega głośność dźwięków o różnym poziomie dźwięku. Poruszany problem należy rozpatrywać oddzielnie dla dwóch grup użytkowników – osób słyszących prawidłowo oraz osób z ubytkiem słuchu. W pierwszym przypadku należy zadbać o to, aby wyznaczona charakterystyka dynamiki właściwie przetwarzała dźwięki...
-
Extreme value theory for detecting heavy tails of large claims / Rozpoznawanie grubości ogona rozkładów wielkich roszczeń z użyciem teorii wartości ekstremalnych
Publication -
Ionophores in polymeric membranes for selective ion recognition:impedance studies
PublicationW pracy badano dwa typy elektrod: membranowe elektrody jonoselektywne (ISE) oraz elektrody nowego typu all-solid-state (AAS). Elektrody AAS zawierają przewodzącą warstwę polimerową na węglu szklistym lub platynie, na który nałożona jest membrana zawierająca jonofor. Do badań użyto dwa jonofory: p-tert-butylokaliks[4]aren-korona-4 (L1) selektywnie kompleksująca jony Na+ oraz kaliks[4]aren-korona-6 (L2) selektywnie kompleksująca...
-
Musical instrument sound separation methods supported by artificial nueural network decision system
PublicationRozprawa doktorska (27 czerwica 2006).Celem prowadzonych prac badawczych było opracowanie algorytmów separacji dźwięków instrumentów muzycznych. Dodatkowo dobrano zestaw parametrów tak aby możliwe było wytrenowanie sztucznej sieci neuronowej w celu automatycznego rozpoznawania odseparowanych sygnałów. Zaproponowano również aby algorytm decyzyjny odpowiedzialny za klasyfikacje dźwięków pełnił funkcję automatycznej metody oceny algorytmów...
-
WYKORZYSTANIE SIECI NEURONOWYCH I METODY WEKTORÓW NOŚNYCH SVM W PROCESIE ROZPOZNAWANIA AKTYWNOŚCI RUCHOWEJ PACJENTÓW DOTKNIĘTYCH CHOROBĄ PARKINSONA
PublicationChoroba Parkinsona (ang. PD - Parkinson Disease) zaliczana jest do grupy chorób neurodegeneracyjnych. Jest to powoli postępująca choroba zwyrodnieniowa ośrodkowego układu nerwowego. Jej powstawanie związane jest z zaburzeniem produkcji dopaminy przez komórki nerwowe mózgu. Choroba manifestuje się zaburzeniami ruchowymi. Przyczyna występowania tego typu zaburzeń nie została do końca wyjaśniona. Leczenie osób dotkniętych PD oparte...
-
Ankieta intuicyjności gestów rąk zastosowanych od obsługi operacji miksowania dźwięku
PublicationW niniejszym raporcie przedstawiono wyniki prac realizowanych przez studentów specjalności Inżynieria Dźwięku i Obrazu Katedry Systemów Multimedialnych w ramach projektu grupowego. Celem projektu było stworzenie grafiki dla aplikacji komputerowej symulującej wybrane operacje możliwe do zrealizowania przy pomocy konsolety fonicznej (stołu mikserskiego). Ów system miksowania ścieżek nagrania muzycznego sterowany jest za pomocą gestów....
-
Recognition of hazardous acoustic events employing parallel processing on a supercomputing cluster . Rozpoznawanie niebezpiecznych zdarzeń dźwiękowych z wykorzystaniem równoległego przetwarzania na klastrze superkomputerowym
PublicationA method for automatic recognition of hazardous acoustic events operating on a super computing cluster is introduced. The methods employed for detecting and classifying the acoustic events are outlined. The evaluation of the recognition engine is provided: both on the training set and using real-life signals. The algorithms yield sufficient performance in practical conditions to be employed in security surveillance systems. The...
-
Language material for English audiovisual speech recognition system developmen . Materiał językowy do wykorzystania w systemie audiowizualnego rozpoznawania mowy angielskiej
PublicationThe bi-modal speech recognition system requires a 2-sample language input for training and for testing algorithms which precisely depicts natural English speech. For the purposes of the audio-visual recordings, a training data base of 264 sentences (1730 words without repetitions; 5685 sounds) has been created. The language sample reflects vowel and consonant frequencies in natural speech. The recording material reflects both the...
-
Stworzenie stereofonicznej ścieżki dźwiękowej do filmu symulującej dźwięk wielokanałowy
PublicationCelem referatu pracy jest przedstawienie procesu tworzenia stereofonicznej ścieżki dźwiękowej do filmu, symulującej dźwięk wielokanałowy w odsłuchu słuchawkowym. Opracowana symulacja dźwięku wielokanałowego wykorzystuje filtrację HRTF (ang. Head-Related-Transfer-Function). W celu umożliwienia jednoczesnego odsłuchu kilku partii instrumentalnych składających się na ścieżkę dźwiękową stworzona została aplikacja wraz z graficznym...
-
Auditory Display Applied to Research in Music and Acoustics . Obrazowanie dźwiękowe w muzyce i akustyce.
PublicationThis paper presents a relationship between Auditory Display (AD) and the domains of music and acoustics. First, some basic notions of the Auditory Display area are shortly outlined. Then, the research trends and system solutions within the fields of music technology, music information retrieval and music recommendation and acoustics that are within the scope of AD are discussed. Finally, an example of AD solution based on gaze...
-
Estymator wysokości chwilowej dźwięku w oparciu o jego zespoloną pulsację chwilową
PublicationW pracy zaprezentowano oryginalny algorytm estymacji wysokości chwilowej dźwięku. Wykorzystuje on zespolone filtry cyfrowe Hilberta o różnej szerokości pasm przepustowych. W eksperymentach posłużono się filtami nacelowanymi na wyznaczanie częstotliwości krtaniowej (odwrotności okresu drgań strun głosowych) na podstawie zarejestrowanych samogłosek wypowiadanych głosem męskim, żeńskim i dziecięcym. W algorytmie zastosowano estymator...
-
Co w architekturze piszczy? Dźwiękowy wymiar przestrzeni / What’s the buzz in architecture? – The sonic aspect of space
PublicationThe article presents a debate on the dividing line between architecture and the sound sciences. It sketches out the theoretical and practical aspects of space development in the context of its sonic reception. The analysis is based on examples of projects combining architecture and art in public space and their consequences for the reception of this space. The projects relate to the use of art in urban space with special emphasis...
-
Automatic classification of singing voice quality
PublicationW artykule przedstawiono zagadnienia związane z automatyczną klasyfikacją jakości i rodzajów głosów śpiewaczych. Na potrzebę takiej klasyfikacji stworzono bazę głosów śpiewaczych, w której dokonano parametryzacji nagrań samogłosech śpiewanych przez różnych wokalistów (zarówno profesjonalistów jak i amatorów) na różnych wysokościach i z różną głośnością. W celu ograniczenia wymiaru wektora opisu zastosowano statystykę Behrensa Fishera...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...