Wyniki wyszukiwania dla: klasyfikator%20sekwencyjny
-
Piotr Szczuko dr hab. inż.
OsobyDr hab. inż. Piotr Szczuko w 2002 roku ukończył studia na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej zdobywając tytuł magistra inżyniera. Tematem pracy dyplomowej było badanie zjawisk jednoczesnej percepcji obrazu cyfrowego i dźwięku dookólnego. W roku 2008 obronił rozprawę doktorską zatytułowaną "Zastosowanie reguł rozmytych w komputerowej animacji postaci", za którą otrzymał nagrodę Prezesa Rady...
-
System rozpoznawania mowy wykorzystujący cechy wizualne
PublikacjaNiniejszy artykuł przedstawia metodę rozpoznawania głosek na podstawie analizy ruchu ust, która może znaleźć zastosowanie w terapii logopedycznej osób z wadami słuchu. W pracy opisano algorytm wyznaczana i śledzenia położenia ust oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. Dodatkowo przeprowadzono...
-
Automatyczna klasyfikacja gatunków muzycznych
PublikacjaCelem referatu jest dokonanie krótkiego przeglądu stanu badań w dziedzinie wyszukiwania i klasyfikacji gatunków muzycznych. Ponadto przedstawiony zostanie eksperyment polegający na klasyfikacji wybranych gatunków muzycznych z wykorzystaniem przykładowego klasyfikatora. W pierwszej kolejności zaprezentowano proces selekcji cech dystynktywnych. Opracowany wektor cech został następnie poddany testom klasyfikacji na zamkniętym zbiorze...
-
Vowel recognition based on acoustic and visual features
PublikacjaW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...
-
Zautomatyzowana budowa modeli 3D pomieszczeń
PublikacjaW artykule przedstawiono budowę systemu do automatycznej budowy modeli 3D wnętrz budynków. System taki może być stosowany do tworzenia lokacji w grach komputerowych. Model jest tworzony na bazie kolorowych oraz głębokościowych obrazów pobranych z kamery Microsoft Kinect. Opisano architekturę komponentową systemu, zastosowane sterowniki do komunikacji. Podano zastosowany algorytm sekwencyjny i równoległy, środowisko testowe oraz...
-
Konstrukcja bazy danych dla systemu wspomagania diagnostyki chorób przewodu pokarmowego
PublikacjaW artykule krótko przedstawiono charakterystykę procesu diagnostyki chorób przewodu pokarmowego oraz istniejące techniki wspomagania go na bazie analizy zdjęć z badań endoskopowych. Szczegółowo opisano proces tworzenia specjalistycznej bazy danych medycznych, której przeznaczeniem jest wspomaganie procesu uczenia klasyfikatorów chorób przewodu pokarmowego. Na koniec przedstawiono zebrane w bazie dane oraz uzyskane efekty.
-
Algorytmy obróbki danych dla diagnostyki ran pooperacyjnych w kardiochirurgii
PublikacjaDo oceny procesu gojenia ran pooperacyjnych wykorzystana została koncepcja aktywnej termografii dynamicznej (ATD) z pobudzeniem w postaci nawiewu mieszaniny powietrza i rozprężonego CO2. Specyficzne dla aplikacji oceny gojenia ran jest przetwarzanie uzyskanych sekwencji termogramów polegające na analizie rozkładów parametrów modelu dwueksponencjalnego wzdłuż linii cięcia w kolejnych dwóch badaniach - w trzeciej i szóstej dobie...
-
Metoda i algorytmy sterowania procesami miksowania dźwięku za pomocą gestów w oparciu o analizę obrazu wizyjnego
PublikacjaGłównym celem rozprawy było opracowanie systemu miksowania dźwięku za pomocą gestów rąk wykonywanych w powietrzu oraz zbadanie możliwości oferowanych przez takie rozwiązanie w porównaniu ze współczesną metodą miksowania sygnałów fonicznych, wykorzystującą środowisko komputera. Opracowany system rozpoznaje zarówno dynamiczne jak i statyczne gesty rąk. Rozpoznawanie gestów dynamicznych zrealizowano w oparciu o metody logiki rozmytej...
-
Strategie treningu neuronowego estymatora częstotliwości tonu krtaniowego z użyciem generatora syntetycznych samogłosek
PublikacjaW wielu zastosowaniach telekomunikacyjnych pojawia się problem przetwarzania lub analizy sygnału mowy, w ramach którego, często w obszarze podstawowych algorytmów, stosuje się estymator częstotliwości tonu krtaniowego. Estymator rozpatrywany w tej pracy bazuje na neuronowym klasyfikatorze podejmującym decyzje na podstawie częstotliwości oraz mocy chwilowej wyznaczanych w podpasmach analizowanego sygnału mowy. W pracy rozważamy...
-
Analiza Nagrań Ruchu Drogowego w Kontekście Akustycznej Klasyfikacji Typu Pojazdu
PublikacjaCelem niniejszej pracy jest przeprowadzenie analizy sygnału fonicznego w kontekście klasyfikacji typu pojazdu. Część teoretyczna zawiera krytyczny przegląd systemów monitorowania ruchu drogowego, w szczególności systemów ITS (Intelginet Transport System). Część praktyczna przedstawia założenia dotyczące przygotowania bazy nagrań testowych, uwzględniających różne scenariusze ruchu drogowego. Zarejestrowane sesje nagraniowe przetworzono,...
-
Identyfikacja lotnych związków na podstawie odpowiedzi matryc czujników gazów
PublikacjaW pracy przedstawiono koncepcję systemu analizy odpowiedzi matrycy czujników gazu wykorzystującą wielowymiarową analizę danych i prowadzącą do identyfikacji lotnych związków występujących w powietrzu. Przedstawione podejście składa się z dwóch etapów. W pierwszym kroku wykonuje się proces kalibracji, polegający na utworzeniu w przestrzeni dwuwymiarowej grupy klas odpowiadających odpowiedziom czujników na konkretne związki. Drugi...
-
Identyfikacja lotnych związków na podstawie odpowiedzi matryc czujników gazu
PublikacjaW pracy przedstawiono koncepcję systemu wykorzystującego wielowymiarową analizę danych, który służyć będzie do analizy odpowiedzi matrycy czujników gazu w celu identyfikacji lotnych związków występujących w powietrzu. Przedstawione podejście składa się z dwóch etapów. W pierwszym kroku wykonuje się proces kalibracji, polegający na utworzeniu w przestrzeni dwuwymiarowej grupy klas odpowiadających odpowiedziom czujników na konkretne...
-
Analiza istotności cech znamion skórnych dla celów diagnostyki czerniaka złośliwego
PublikacjaPomimo dynamicznego rozwoju metod uczenia maszynowego i ich wdrażania do praktyki lekarskiej, automatyczna analiza znamion skórnych wciąż jest nierozwiązanym problemem. Poniższy artykuł proponuje zastosowanie algorytmu ewolucyjnego do zaprojektowania, wytrenowania i przetestowania całych populacji klasyfikatorów (sztucznych sieci neuronowych) oraz ich iteracyjnego udoskonalania w każdej kolejnej populacji, w celu osiągnięcia jak...
-
Paremetrization of sounds for recognizing hazarodus events
PublikacjaNowoczesne systemy monitoringu działają na zasadzie automatycznego wykrywania niebezpiecznych zdarzeń na podstawie analizy obrazu z kamer i dźwięku z mikrofonów. W niniejszej publikacji skupiono się na pierwszym etapie rozpoznawania zdarzeń dźwiękowych, jakim jest parametryzacja dźwięku. Podstawą do skutecznego działania systemu jest znalezienie parametrów, których zmienność najlepiej odzwierciedla cechy charakterystyczne dźwięku...
-
Wpływ dodatku regeneratów gumowych na charakterystykę sieciowania oraz właściwości mechaniczne kauczuku butadienowo-styrenowego
PublikacjaPrzedstawiono wyniki badań wpływu regeneratów gumowych otrzymanych w różnych warunkach ścinania na przebieg procesu wulkanizacji oraz statyczne i dynamiczne właściwości mechaniczne wulkanizatów mieszanek kauczuku butadienowo-styrenowego i regeneratu gumowego. Regenerację miału gumowego prowadzono metodą periodyczną przy użyciu walcarki oraz metodą ciągłą z zastosowaniem wytłaczarki dwuślimakowej współbieżnej. W celu poprawy przetwórstwa...
-
Investigations of speech signal parameters with regard to articulation influences
PublikacjaW pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...
-
Specjalizowane sieci neuronowe z Dwucentrowymi Funkcjami Bazowymi do zastosowań w testerach wbudowanych μBIST
PublikacjaPrzedmiotem artykułu są nowe, przydatne do zastosowań w testerach wbudowanych BIST, specjalizowane sieci neuronowe do lokalizacji uszkodzeń parametrycznych analogowych układów elektronicznych, o podwyższonej odporności na maskujący wpływ rozrzutów tolerancyjnych elementów nieuszkodzonych. Sieci opracowane zostały w dwóch wariantach: z Dwucentrowymi Radialnymi (DRB) oraz Elipsoidalnymi (DEB) funkcjami Bazowymi. Dzięki wydłużonym...
-
Modelowanie wpływu bezdechu na zmiany szerokości przestrzeni podpajęczynówkowej u zdrowych ochotników
PublikacjaDiagnostyka głowy oraz stanu mózgu jest jedną z najtrudniejszych w medycynie. Ze względu na skomplikowaną budowę i dużą wrażliwość mózgu na uszkodzenia, ważne jest rozwijanie metod diagnostycznych. Obecnie stosowane metody, takie jak rezonans magnetyczny czy tomograf komputerowy dają znakomite efekty, ale nie pozwalają na ciągły monitorowania zmian, które, na przykład po wypadku bądź po urazie mechanicznym, mogą być kluczowe dla...
-
Wykorzystanie analizy obrazu ruchów głowy w multimedialnym interfejsie komputerowym
PublikacjaOpracowany interfejs komputerowy umożliwia przeglądanie obrazów statycznych, materiału wizyjnego i fonicznego. Obrazy mogą być przeglądane i wyświetlane w trybie pełnoekranowym. Pliki multimedialne są ułożone w hierarchicznej, wielopoziomowej strukturze. Użytkownik nawiguje po tej strukturze i wyświetla poszczególne elementy poprzez ruch głową w górę, dół, lewo i prawo. Akcja wykonywana przez system zależy od typu zawartości, którą...
-
Spirala 2 (wg Ulama) z cyklu No Quick Response
PublikacjaSpirala 2 (wg Stanisława Ulama) Obraz odnosi się do modelu matematycznego nazywanego Spiralą Ulama, który polega na okrężnym zapisie w polu kwadratu liczb naturalnych od 1 do nieskończoności. Taki zapis uwidacznia szczególne wzory, które powstają z położenia liczb pierwszych (niepodzielnych). Liczby pierwsze tworzą ciągi mniej lub bardziej regularne w układzie diagonalnym, poziomym i pionowym. W obrazie Spirala 2 wykorzystany...