Search results for: ANALIZA NAGRAŃ
-
Analiza Nagrań Ruchu Drogowego w Kontekście Akustycznej Klasyfikacji Typu Pojazdu
PublicationCelem niniejszej pracy jest przeprowadzenie analizy sygnału fonicznego w kontekście klasyfikacji typu pojazdu. Część teoretyczna zawiera krytyczny przegląd systemów monitorowania ruchu drogowego, w szczególności systemów ITS (Intelginet Transport System). Część praktyczna przedstawia założenia dotyczące przygotowania bazy nagrań testowych, uwzględniających różne scenariusze ruchu drogowego. Zarejestrowane sesje nagraniowe przetworzono,...
-
Usuwanie zakłóceń impulsowych z archiwalnych nagrań fonicznych
PublicationWniniejszej pracy doktorskiej opisano nowe metody usuwania zakłóceń impulsowych z archiwalnych nagrań dźwiękowych odtworzonych z płyt gramofonowych. Przedstawione w rozprawie rozwiązania, takie jak analiza dwukierunkowa, dwuzakresowe modelowanie autoregresyjne oraz modelowanie wektorowe umożliwiają przetwarzanie zarówno sygnałów muzycznych jak sygnałów mowy przy zachowaniu wysokiej jakości dźwięku po obróbce. Testy odsłuchowe przeprowadzone...
-
System synchronizacji nagrań wielokanałowych
PublicationNiniejsza praca zawiera opis komputerowego systemu synchronizacji wielu dźwięków pochodzących z nagrania jednej wypowiedzi przy wykorzystaniu kilku mikrofonów i różnych niezsynchronizowanych urządzeń rejestrujących. System wykorzystuje korelację skrośną.
-
System synchronizacji nagrań wielokanałowych
PublicationNiniejsza praca zawiera opis komputerowego systemu synchronizacji wielu dźwięków pochodzących z nagrania jednej wypowiedzi przy wykorzystaniu kilku mikrofonów i różnych niezsynchronizowanych urządzeń rejestrujących. System wykorzystuje korelację skrośną.
-
Wyszukiwarka nagrań muzycznych - Serwis muzyczny Synat
PublicationW pracy przedstawiono opracowany w ramach projektu Synat serwis klasyfikacji nagrań muzycznych, a także pro-blemy i rozwiązania systemowe zrealizowane w celu zapew-nienia większej skuteczności wyszukiwania treści muzycz-nych. W ramach eksperymentów przeprowadzono testy skuteczności klasyfikacji gatunków muzycznych na pod-stawie obliczonych wektorów parametrów z wykorzysta-niem algorytmów decyzyjnych. W pracy zawarto szczegó-łowe...
-
Wspomaganie procesu wyszukiwania nagrań w repozytoriach muzycznych
PublicationCelem referatu jest przegląd kluczowych zagadnień związanych z automatycznym wyszukiwaniem informacji muzycznej MIR - Music Information Retrieval. W pierwszej kolejności przedstawiono aktualne kierunki badań i rozwiązań systemowych związane z wyszukiwaniem i rekomendacją muzyki. Następnie zaprezentowano eksperymenty przeprowadzone na skonstruowanej bazie muzycznej. Pokazano również propozycję wspomagania procesu wyszukiwania i...
-
Repozytorium nagrań testowych i algorytmy wspomagania systemów monitoringu przestrzeni publicznej
PublicationW referacie przedstawiono założenia i realizację repozytorium nagrań testowych dla potrzeb oceny algorytmów analizy obrazu. Celem wykonanej pracy jest zgromadzenie materiałów audiowizualnych zawierających różne rodzaje zachowań tłumu wraz z opisem służących do weryfikacji algorytmów analizy obrazu. Omówiono szczegółowo treść nagrań wprowadzonych do repozytorium, wśród których wyróżnić można zachowania typowe jak i nietypowe. Przedstawiono...
-
Anonimizacja obrazów z nagrań endoskopowych w systemie wspomagania diagnostyki chorób przewodu pokarmowego
PublicationW artykule skoncentrowano sie na problemie anonimizacji obrazów z filmów endoskopowych w systemie wspomagania diagnostyki przewodu pokarmowego. Opisano źródła obrazów endoskopowych pod katem zawartosci danych personalnych. Zaproponowano algorytmy automatycznego usuwania tych danych, zbadano ich skutecznosc oraz dokonano oceny przydatnosciw systemie wspomagania diagnostyki.
-
Accidental wow defect evaluation using sinusoidal analysis enhanced by artificial neural networks
PublicationArtykuł przedstawia metodę do wyznaczania charakterystyki pasożytniczych modulacji częstotliwości (kołysanie) obecnych w archiwalnych nagraniach dźwiękowych. Prezentowane podejście wykorzystuje śledzenie zmian sinusoidalnych komponentów dźwięku które odzwierciedlają przebieg kołysania. Analiza sinusoidalna wykorzystana jest do ekstrakcji składowych tonalnych ze zniekształconych nagrań dźwiękowych. Dodatkowo, w celu zwiększenia...
-
Analiza zależności muzyczno-graficznej okładek albumów z użyciem algorytmów uczących się
PublicationCelem rozprawy jest analiza zależności muzyczno-graficznej okładek albumów z użyciem algorytmów uczących się. Brane są pod uwagę parametry badanych gatunków muzycznych, zależności pomiędzy gatunkami muzycznymi a typami osobowości, jak również cechy okładek albumów muzycznych i ich korelacje z gatunkami muzycznymi. Opracowana metodologia jest wykorzystana w celu sprawdzenia możliwości automatycznej klasyfikacji gatunku muzycznego...
-
Analiza zachowań tłumu w multimedialnym systemie bezpieczeństwa
PublicationW niniejszym referacie zawarto opis metody detekcji zachowań tłumu na podstawie analizy obrazu. Koncepcja docelowego wykorzystania to wspomaganie pracy operatorów w systemach monitoringu, w szczególności podczas imprez masowych, np. na stadionach wyposażonych w wiele kamer. Celem opracowanej metody jest wykrywanie normalnych oraz potencjalnie niebezpiecznych zachowań tłumu, takich jak: panika, kierunkowy ruch masy ludzi, czy gromadzenie...
-
Ocena możliwości zautomatyzowanej analizy obrazów z badań endoskopowych do wspomagania diagnostyki gastropatii wrotnej
PublicationAnaliza obrazów z powszechnie wykonywanych badań endoskopowych jest jedną z możliwych metod wykrywania wczesnego stadium gastropatii wrotnej fragmentów przewodu pokarmowego człowieka. W artykule przedstawiono opis eksperymentów związanych z utworzeniem autorskiego algorytmu wykrywania gastropatii na obrazach z nagrań badań endoskopowych w celu wspomagania procesu diagnostycznego. Przedstawiono cechy charakterystyczne schorzenia....
-
Analiza używania hulajnóg elektrycznych w miastach w kontekście bezpieczeństwa ruchu drogowego na przykładzie Gdańska
PublicationTematem artykułu jest analiza wpływu hulajnóg elektrycznych na bezpieczeństwo ruchu drogowego w miastach, ze szczególnym uwzględnieniem Gdańska. W pierwszej części, która jest teoretycznym wprowadzeniem do tematu, przedstawiono – w oparciu o zagraniczne publikacje – na jaką skalę ludzie na całym świecie korzystają z hulajnóg elektrycznych i jakie zagrożenia z tego wynikają. Z powodu braku polskiej literatury w zakresie tego stosunkowo...
-
Akustyczna analiza parametrów ruchu drogowego z wykorzystaniem informacji o hałasie oraz uczenia maszynowego
PublicationCelem rozprawy było opracowanie akustycznej metody analizy parametrów ruchu drogowego. Zasada działania akustycznej analizy ruchu drogowego zapewnia pasywną metodę monitorowania natężenia ruchu. W pracy przedstawiono wybrane metody uczenia maszynowego w kontekście analizy dźwięku (ang.Machine Hearing). Przedstawiono metodologię klasyfikacji zdarzeń w ruchu drogowym z wykorzystaniem uczenia maszynowego. Przybliżono podstawowe...
-
Technologia nagrań II
e-Learning CoursesZagadnienia związane z technologią nagrań - na poziomie zaawansowanym. Zagadnienia te obejmują m.in. techniki (mikrofonowe) wielokanałowe oraz realizację dźwięku wielokanałowego.
-
Technologia nagrań II - 2023
e-Learning CoursesTematem wykładu będą: mikrofonowe techniki wielokanałowe, zagadnienia związane z dźwiękiem przestrzennym (3D), a szczególności z ambisonią, muzyka w technologii nagrań, realizacja dźwięku wielokanałowego w TV, zagadnienia związane z dokumentacją nagrań, formatem id3 oraz przykładami narracji muzyki w filmie. Przedstawione będą również pokrótce zasady prowadzenia testów subiektywnych oraz „warsztat realizatora dźwięku”
-
Technologia nagrań II - 2024
e-Learning CoursesTematem wykładu będą: mikrofonowe techniki wielokanałowe, zagadnienia związane z dźwiękiem przestrzennym (3D), a szczególności z ambisonią, muzyka w technologii nagrań, realizacja dźwięku wielokanałowego w TV, zagadnienia związane z dokumentacją nagrań, formatem id3 oraz przykładami narracji muzyki w filmie. Przedstawione będą również pokrótce zasady prowadzenia testów subiektywnych oraz „warsztat realizatora dźwięku”
-
Technologia nagrań I - laboratorium - 2022
e-Learning CoursesW ramach niniejszego kursu prowadzone będą zajęcia laboratoryjne z przedmiotu "Technologia nagrań I".
-
Technologia nagrań I - laboratorium - 2023
e-Learning CoursesW ramach niniejszego kursu prowadzone będą zajęcia laboratoryjne z przedmiotu "Technologia nagrań I".
-
Technologia nagrań I - laboratorium - 2024
e-Learning CoursesW ramach niniejszego kursu prowadzone będą zajęcia laboratoryjne z przedmiotu "Technologia nagrań I".
-
Technologia nagrań I - 2023_2024
e-Learning CoursesWykład dla sem. I - studia mgr WETI, kier. EiT, specj. Inżynieria dźwięku i obrazu oraz przedmiot uzupełniający dla pozostałych specjalności. Celem przedmiotu jest zapoznanie studentów z zagadnieniami dotyczącymi technologii nagrań w zakresie podstawowym. Przedmiot obejmuje wykład oraz laboratorium. Zasady zaliczenia przedmiotu zostały podane na wykładzie wprowadzającym. Harmonogram zajęć (oraz literatura) znajdują się na linku: https://sound.eti.pg.gda.pl/student/harmonogram.html Materiały...
-
Automatic system for audio-video material reconstruction and archiving
PublicationReferat przedstawia propozycję modelu systemu automatycznej archiwizacji i rekonstrukcji nagrań audio-wideo. Założeniem tego rozwiązania jest uczynienie procesu rekonstrukcji nagrań bardziej niezależnym od człowieka. Ma to na celu redukcję kosztów rekonstrukcji przetwarzanych nagrań. Z powodu dużej liczby archiwalnych nagrań audio-wideo istnieje potrzeba stworzenia systemu który umożliwi automatyczną indeksację ich treści. Pomoże...
-
Technologia nagrań II - laboratorium i seminarium
e-Learning Courses -
OCENA FUNKCJONOWANIA PASÓW RUCHU DLA ROWERÓW – PRZYPADEK TRÓJMIASTA
PublicationArtykuł dotyczy analizy nagrań trzech wybranych odcinków skrzyżowań w Gdańsku, na których znajdują się pasy dla rowerów wyznaczone w ramach jezdni. Na podstawie ww. materiału filmowego została wykonana ocena organizacji i natężenia ruchu, zachowania rowerzystów i kierowców oraz analiza sytuacji konfliktowych. Na każdym z trzech poligonów badawczych zostały przeanalizowane zachowania rowerzystów w ich obrębie. Przedstawiono liczbę...
-
KORPUS MOWY ANGIELSKIEJ DO CELÓW MULTIMODALNEGO AUTOMATYCZNEGO ROZPOZNAWANIA MOWY
PublicationW referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus...
-
Technologia nagrań II - laboratorium i seminarium 2022/2023
e-Learning Courses -
Technologia Nagrań II - seminarium i laboratorium (zima 2023)
e-Learning Courses -
Technologia nagrań II - laboratorium i seminarium 2024/2025
e-Learning Courses -
Technologia Nagrań II - seminarium i laboratorium (zima 2023)
e-Learning Courses -
Technologia nagrań II (L&S) 2023-2024
e-Learning Courses -
Modernizacja sali koncertowej im G. Fitelberga w Górnośląskim Centrum Kultury w Katowicach
PublicationPrzedstawiono koncepcję modernizacji sali w poszerzonej funkcji użytkowej(sala koncertowa, studio nagrań dużych form muzycznych, przedstawienia operowe, operetkowe i musicalowe w zredukowanych dekoracjach). Uwzględniono ograniczenia konstrukcyjne i gruntowe.
-
Nagranie formy muzycznej w systemie stereofonii dookólnej
PublicationCelem pracy była realizacja nagrania kwintetu jazzowego w wybranych systemach stereofonii wielokanałowej. Dodatkowym celem było przeprowadzenie testów subiektywnych zrealizowanych nagrań. W pracy zawarto w pierwszej kolejności zagadnienia związane z przestrzenną lokalizacją źródeł dźwięku przez człowieka. W dalszej części przywołane zostały wybrane techniki mikrofonowe stereofonii wielokanałowej, a także metody prowadzenia testów...
-
Marek Galewski dr hab. inż.
PeopleMgr inż. - 2002r. - Politechnika Gdańska; Wydział Elektroniki, Telekomunikacji i Informatyki; Automatyka i RobotykaDr inż. - 2007r. - Politechnika Gdańska; Wydział Mechaniczny; Budowa i eksploatacja maszynDr hab. inż. - 2016r. - Politechnika Gdańska; Wydział Mechaniczny; Budowa i eksploatacja maszyn Dotychczasowe i planowane obszary badań: Redukcja drgań podczas obróbki frezowaniem i toczeniem Zastosowanie zmiennej prędkości...
-
Processing of musical metadata employing Pawlak's flow graphs.
PublicationW artykule przedstawiono problemy wyszukiwania informacji muzycznej. W eksperymentach posłużono się meta opisem oraz wykorzystano metodę grafów przepływowych Pawlaka. Opisano skonstruowaną bazę nagrań muzycznych. Słowa kluczowe: meta opis, wyszukiwanie informacji muzycznej, baza danych muzycznych
-
Applications of neural networks and perceptual masking to audio restoration
PublicationOmówiono zastosowania algorytmów uczących się w dziedzinie rekonstruowania nagrań fonicznych. Szczególną uwagę zwrócono na zastosowanie sztucznych sieci neuronowych do usuwania zakłócających impulsów. Ponadto opisano zastosowanie inteligentnego algorytmu decyzyjnego do sterowania maskowaniem perceptualnym w celu redukowania szumu.
-
Decomposition of duet instrument sounds. W: [CD-ROM] International Sympo-sium of Musical Acoustics. ISMA MEXICO CITY. Mexico City, 9-13 December 2002. Mexico City: Escuela Nacional de Musica UNAM**2002, 10 s. 4 rys. 2 tab. bibliogr. 15 poz. Dekompozycja duetów muzycznych.
PublicationW referacie zaprezentowany został algorytm separacji nagrań duetów muzycz-nych. Metoda separacji oparta została na algorytmie FED, przy pomocy któregomożliwa jest ekstrakcja części harmonicznych sygnałów. Ponadto wykorzystanyzostał algorytm estymacji częstotliwości podstawowej oparty na korelacjiskrośnej, w celu estymacji częstotliwości dekomponowanych harmonicznych.
-
Modernization of large music studio at Polish Radio Szczecin
PublicationStudio Muzyczne S-1 w Polskim Radiu Szczecin należy do największych studiów nagrań w Polsce. Wymiary studia wynoszą 15.3 x 17 x 8.6 m, powierzchnia 261 m2, kubatura 2244 m3. W wyniku licznych korekt akustycznych dokonanych w ciągu ostatnich lat, warunki akustyczne studia są akceptowane przez szeroki krąg realizatorów i wykonawców, co uznano to za cenny i trudno odtwarzalny walor techniczny. W związku z tym, modernizację Studia...
-
Technologia studyjna - 2023
e-Learning CoursesTematem wykładu będą zagadnienia związane z nagraniem formy słownej, technikami mikrofonowymi (typy, rodzaje i charakterystyki mikrofonów) oraz przykłady nagrań instrumentów muzycznych, głośniki, zestawy głośnikowe i słuchawki, studia wizyjno‐fonicznych, realizacja nagrań wideofonicznych, dźwięk w multimediach, kwestie związane z prawem autorskim.
-
Technologia studyjna - 2024
e-Learning CoursesTematem wykładu będą zagadnienia związane z nagraniem formy słownej, technikami mikrofonowymi (typy, rodzaje i charakterystyki mikrofonów) oraz przykłady nagrań instrumentów muzycznych, głośniki, zestawy głośnikowe i słuchawki, studia wizyjno‐fonicznych, realizacja nagrań wideofonicznych, dźwięk w multimediach, kwestie związane z prawem autorskim.
-
Techniki wielokanałowe wykorzystywane w koncertach i nagraniach muzycznych na odległość
PublicationW czasie pandemii koronawirusa COVID-19 nowego znaczenia nabrały możliwości transmisji dźwięku z obrazem – zwłaszcza do pracy zdalnej, która w przypadku muzyków jest szczególnym wyzwaniem zarówno w kontekście wspólnych ćwiczeń i prób, jak i koncertów. Wynikła konieczność wieloźródłowego połączenia ujawniła potrzebę uprzestrzennienia dźwięku w celu łatwiejszej lokalizacji źródeł dźwięku. Tworzenie zdalnych nagrań muzycznych stało...
-
Projekt COPSIMO - nowe techniki dystrybucji multimediów
PublicationPrzedstawiono założenia, realizowanego z udziałem Katedry Systemów Multimedialnych, projektu europejskiego COPSIMO, którego celem jest opracowanie sieci typu peer-to-peer, umożliwiającej wymianę nagrań multimedialnych na terenie krajów Unii Europejskiej. Sieć ta będzie zbudowana z wykorzystaniem architektury niewykorzystującej serwerów centralnych i wyposażona w mechanizmy zabezpieczające prawa autorskie twórców.
-
Projekt COPSIMO - nowe technologie dystrybucji multimediów
PublicationW komunikacie przedstawiono założenia, realizowanego z udziałem Katedry Systemów Multimedialnych, projektu europejskiego COPSIMO, którego celem jest opracowanie sieci typu peer-to-peer, umożliwiającej wymianę nagrań multimedialnych na terenie krajów Unii Europejskiej. Sieć ta będzie zbudowana z wykorzystaniem architektury niewykorzystującej serwerów centralnych i wyposażona w mechanizmy zabezpieczające prawa autorskie twórców.
-
Comparing some convolution-based methods for creation of surround sound. W: [CD-ROM] Collected papers. First Pan-American/Iberian Meeting on Acoustics. 144 Meeting of the Acoustical Society of America. III Iberoamerican Cong- ress of Acoustics. 9o Mexican Congress of Acoustics. Cancun, Q. R. Mxico, 2-6 Dec. 2002. [B.m.:ASA]**2002 paper 2pPP22, 7 s. 8 rys. 1 tab. bibliogr. 12 poz. system nagrań dźwięku dookólnego z wykorzystaniem splotu odpowiedzi impul- sowej sali.
PublicationW referacie przedstawiono eksperymenty związane z symulacją dźwięku dookól-nego w sali koncertowej. W tym celu wykorzystano splot odpowiedzi impulsowejz danego wnętrza (wielokanałowe nagrania odpowiedzi impulsowej) z nagraniamiz komory bezechowej. Uzyskany w ten sposób sygnał został następnie przypisa-ny do odpowiednich kanałów w systemie dookólnym. Uzyskane w ten sposób nag-rania były następnie porównywane w testach subiektywnych...
-
System automatycznej analizy poziomu emisji reklam nadawanych w TV
PublicationNiniejszy referat przywołuje problem poziomu emisji reklam telewizyjnych. W pierwszej kolejności przedstawiono przegląd wybranych metod analizy poziomu nadawanych sygnałów wizyjno-fonicznych oraz zalecenia normowe dotyczące emisji programów. Opisany został również opracowany system, pozwalający na automatyczną analizę poziomu emitowanych reklam. W eksperymentach wykorzystano przygotowaną bazę nagrań programów telewizyjnych. W referacie...
-
Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej
PublicationW pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą.
-
Online pitch estimation using instantaneous complex frequency
PublicationW pracy opisano nowe wyniki dotyczące skuteczności algorytmu potokowego estymującego częstotliwość podstawową sygnału mowy. Algorytm wykorzystuje zespoloną pulsację chwilową dla klasyfikacji mowy na dźwięczną i bezdźwięczną oraz estymacji częstotliwości podstawowej dla każdej próbki sygnału. Skuteczność klasyfikacji oraz dokładność estymacji zostały ocenione eksperymentalnie z wykorzystaniem dwóch baz nagrań, zawierających wypowiedzi...
-
Zapytania muzyczne do bibliotek cyfrowych
PublicationBiblioteki cyfrowe dokumentów muzycznych umożliwiają przechowywanie różnorodnej, multimedialnej informacji muzycznej. Oprócz opisu bibliograficznego obejmować ona może również dane w postaci nagrań dźwiękowych i wideo, obrazów partytur oraz partytur w postaci cyfrowej.W celu efektywnego wyszukiwania danych muzycznych należy stosować zapytania muzyczne. W rozdziale przedstawiono specyfikę cyfrowych bibliotek muzycznych oraz metody...
-
A system for multitask noisy speech enhancement.
PublicationW artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...
-
Metody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace
PublicationW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących...