Search results for: PRZETWARZANIE OBRAZU
-
Piotr Szczuko dr hab. inż.
PeoplePiotr Szczuko received his M.Sc. degree in 2002. His thesis was dedicated to examination of correlation phenomena between perception of sound and vision for surround sound and digital image. He finished Ph.D. studies in 2007 and one year later completed a dissertation "Application of Fuzzy Rules in Computer Character Animation" that received award of Prime Minister of Poland. His interests include: processing of audio and video, computer...
-
Grzegorz Szwoch dr hab. inż.
PeopleGrzegorz Szwoch was born in 1972 in Gdansk. In 1991-1996 he studied at the Technical University of Gdansk. In 1996 he graduated as a student from the Sound Engineering Department. His thesis was related to physical modeling of musical instruments. Since that time he has been a member of the research staff at the Multimedia Systems Department as a PhD student (1996-2001), Assistant (2001-2004), Assistant professor (2004-2020) and...
-
FPGA and ASIC implementation of the algorithm for traffic monitoring in urban areas
PublicationW artykule przedstawiono algorytm detekcji obrazu oraz jego realizację sprzętową w technikach FPGA i ASIC. Algorytm ten dedykowany jest do detekcji ruchu pojazdów i jest realizowany w czasie rzeczywistym. Użyto pojedynczą, umieszczoną na stałe kamerę monochromatyczną o niskiej rozdzielczości. Wykonywane są również operacje eliminacji cieni i rozjaśnień obrazu. Nachodzenie obiektów na siebie nie jest brane pod uwagę. Realizacja...
-
Przetwarzanie dźwięków i obrazów
e-Learning CoursesCyfrowy tor foniczny i wizyjny. Elementy grafiki komputerowej i jej przetwarzania. Zniekształcenia dźwięku i obrazu, ich przyczyny i podstawowe metody ograniczania. Przetwarzanie brzmienia i synteza dźwięku. Podstawowe metody przetwarzania obrazu wizyjnego. Kodowanie dźwięku w procesie zapisu. Filtracja cyfrowa i metody projektowania filtrów cyfrowych. Podstawowe metody przetwarzania obrazu wizyjnego. Specjalne metody przetwarzania...
-
Rejestracja i analiza kontekstu emocjonalnego człowieka w przetwarzaniu wszechobecnym
PublicationSystemy przetwarzania wszechobecnego tworzące inteligentneśrodowisko podejmują działania na podstawie zebranych informacji nazywanych kontekstem. Umiejętność rozpoznawania ludzkich emocji, jako przejaw wyższej inteligencji, jest ich pożądaną cechą. Istnieje kilka modeli doznań emocjonalnych, które mogą stać się podstawą do budowy uniwersalnego systemu rozpoznającego emocje, bazującego na ekstrakcji cech z danych wejściowych i klasyfkacji...
-
Wydajność środowisk J2SE i C++ / OpenCV w zagadnieniu sterowania komputerem za pomocą gestów
PublicationW rozdziale przedstawiono interfejs sterowania komputerem za pomocą gestów rąk, należący do grupy systemów czasu rzeczywistego o łagodnych granicach (ang. soft real-time). Komponentami systemu są: komputer klasy PC, kamera internetowa, rzutnik multimedialny i ekran dla rzutnika. Oprogramowanie interfejsu opracowano w oparciu o środowiska J2SE i Visual Studio C++ z użyciem biblioteki OpenCV. Moduł systemu realizujący interpretację...
-
Marek Chodnicki dr inż.
People -
Teleinformatyczna akwizycja i przetwarzanie danych dla potrzeb diagnostyki środowiska aglomeracji miejskich
PublicationRozdział przedstawia koncepcję aktualnie opracowywanego systemu służącego do monitorowania hałasu i ruchu drogowego w aglomeracjach miejskich, stanowiącego funkcjonalną część szerszego rozwiązania dotyczącego monitorowania środowiska w miastach. System taki składa się z rozmieszczonych w mieście autonomicznych i uniwersalnych stacji monitorujących oraz serwera gromadzącego, przetwarzającego i prezentującego wyniki z wykorzystaniem...
-
Multi-core processing system for real-time image processing in embedded computer vision applications
PublicationW artykule opisano architekturę wielordzeniowego programowalnego systemu do przetwarzania obrazów w czasie rzeczywistym. Dane obrazu są przetwarzane równocześnie przez wszystkie procesory. System umożliwia niskopoziomowe przetwarzanie obrazów,np. odejmowanie tła, wykrywanie obiektów ruchomych, transformacje geometryczne, indeksowanie wykrytych obiektów, ocena ich kształtu oraz podstawowa analiza trajektorii ruchu. Ang:This paper...
-
Marek Galewski dr hab. inż.
PeopleMgr inż. - 2002r. - Politechnika Gdańska; Wydział Elektroniki, Telekomunikacji i Informatyki; Automatyka i RobotykaDr inż. - 2007r. - Politechnika Gdańska; Wydział Mechaniczny; Budowa i eksploatacja maszynDr hab. inż. - 2016r. - Politechnika Gdańska; Wydział Mechaniczny; Budowa i eksploatacja maszyn Dotychczasowe i planowane obszary badań: Redukcja drgań podczas obróbki frezowaniem i toczeniem Zastosowanie zmiennej prędkości...
-
Metoda OptD do redukcji danych w opracowaniu wyników pomiarów linii elektroenergetycznych
PublicationSkaning laserowy to technologia dostarczająca we względnie krótkim czasie dużą ilość danych pomiarowych. Jest to zarazem pozytywna jak i negatywna cecha tej technologii. Z jednej strony w wyniku skaningu otrzymuje się dane, które szczegółowo odzwierciedlają pomierzony obiekt. Z drugiej strony trudność sprawia przetwarzanie takiej ilości danych i nie zawsze wszystkie dane ze skaningu są niezbędne do realizacji wybranego zadania....
-
Wykorzystanie nowych metod wnioskowania w grafice i animacji komputerowej
PublicationReferat opisuje realizowane zadania badawcze, dotyczące wykorzystana nowych metod wnioskowania (tzw. soft-computingu) w przetwarzaniu grafiki i animacji komputerowej. W pierwszym z zadań, opracowaniu metody poprawy jakości fotografii tekstu przeznaczonych do rozpoznawania znaków, wykorzystano algorytmy przetwarzania obrazów i ich modyfikacje do usuwania ze zdjęcia tła oraz gradientu jasności, następnie nowa metoda filtracji nieliniowej...
-
Przetwarzanie i analiza danych z wykorzystaniem metod geodezyjnych na potrzeby opisu środowiska wodnego
PublicationMonografia traktuje o możliwości wykorzystania analiz obrazowych i przestrzennych w dokonywaniu oceny środowiska wodnego przy zastosowaniu geodezyjnych (w tym teledetekcyjnych) metod pomiarowych. W rozdziale pierwszym dokonano wyznaczenia zasięgu stref zalewowych w zlewni Potoku Strzyża w Gdańsku na skutek opadów nawalnych na odcinku od wypływu cieku ze zbiornika „Srebrniki” do al. Hallera.W rozdziale drugim przedstawiono graficzne...
-
Andrzej Czyżewski prof. dr hab. inż.
PeopleProf. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...
-
Bożena Kostek prof. dr hab. inż.
People -
Przetwarzanie multimediów 2021/2022
e-Learning CoursesKurs poświęcony jest przetwarzaniu obrazu oraz video.
-
Agnieszka Mikołajczyk-Bareła dr inż.
People -
SYSTEM WSPOMAGAJĄCY DIAGNOSTYKĘ CZERNIAKA ZŁOŚLIWEGO PRZY POMOCY METOD PRZETWARZANIA OBRAZU I ALGORYTMÓW INTELIGENCJI OBLICZENIOWEJ
PublicationNowotwory skóry są najczęściej spotykanymi nowotworami na świecie. Czerniaki złośliwe stanowią od około 5 do 7% wszystkich nowotworów złośliwych skóry u człowieka. Ich wczesne zdiagnozowanie jest kluczowym czynnikiem w późniejszej pomyślnej terapii. Niniejsza praca zawiera propozycję rozwinięcia i zautomatyzowania najważniejszej metody diagnozowania czerniaków, metody ABCD Stoltza. W artykule przedstawiono koncepcję i implementację...
-
Analiza znamion skórnych przy pomocy metod przetwarzania obrazu i algorytmów inteligencji obliczeniowej
PublicationNowotwory skóry są najczęściej spotykanymi nowotworami na świecie. Czerniaki złośliwe stanowią od około 5 do 7% wszystkich nowotworów złośliwych skóry u człowieka. Celem pracy była budowa zautomatyzowanego systemu do diagnostyki znamion skórnych pod kątem wykrycia czerniaka złośliwego. Omawiane narzędzie powinno służyć jako system wspomagania decyzji dla lekarzy pierwszego kontaktu lub jako system...
-
Algorytmy wykrywania krawędzi w obrazie
PublicationWykrywanie krawędzi jest pierwszym etapem w cyfrowym przetwarzaniu obrazów. Operacja ta polega na usunięciu informacji takich jak kolor czy też jasność, a pozostawieniu jedynie krawędzi. Efektem tej operacji jest znaczna redukcja ilości danych do dalszej analizy. Pozwala to na zastosowanie w następnych etapach bardziej złożonych algorytmów rozpoznawania obiektów na podstawie kształtu. W artykule zaprezentowano zastosowanie algorytmów...
-
Detekcja obrazu pojazdów w nagraniach wideo oraz eliminacja pasożytniczych sprzężeń akustycznych
PublicationReferat prezentuje dwa niezależne rozwiązania z dziedziny inżynierii dźwięku i obrazu. Pierwsze z nich dotyczy wykrywania obrazu ruchomych pojazdów w nagraniach wideo dla zastosowań w monitoringu ruchu drogowego. Detekcja pojazdów odbywa się poprzez porównanie bieżącej ramki obrazu z modelem tła tworzonym w oparciu o sumę ważoną funkcji Gaussowskich. Zbadano skuteczność tej metody w oparciu o przykładowe nagrania ruchu ulicznego....
-
Audiovisual speech recognition for training hearing impaired patients
PublicationPraca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy...
-
Vowel recognition based on acoustic and visual features
PublicationW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu...
-
System rozpoznawania mowy wykorzystujący cechy wizualne
PublicationNiniejszy artykuł przedstawia metodę rozpoznawania głosek na podstawie analizy ruchu ust, która może znaleźć zastosowanie w terapii logopedycznej osób z wadami słuchu. W pracy opisano algorytm wyznaczana i śledzenia położenia ust oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. Dodatkowo przeprowadzono...
-
Koncepcja stanowiska laboratoryjnego cyfrowego przetwarzania obrazów w robotyce
PublicationPrzedstawiono projekt stanowiska laboratoryjnego przeznaczonego do zapoznania studentów z wybranymi metodami cyfrowego przetwarzania obrazów oraz ich zastosowaniem w robotyce. Zaprezentowano informacje o metodach wykorzystywanych w systemach wizyjnych robotów stacjonarnych jak i mobilnych do nauki których służyć ma stanowisko.
-
Visual Traffic Noise Monitoring in Urban Areas
PublicationThe paper presents an advanced system for railway and road traffic noise monitoring in metropolitan areas. This system is a functional part of a more complex solution designed for environmental monitoring in cities utilizing analyses of sound, vision and air pollution, based on a ubiquitous computing approach. The system consists of many autonomous, universal measuring units and a multimedia server, which gathers, processes and...
-
Detection and segmentation of moving vehicles and trains using Gaussian mixtures, shadow detection and morphological processing
PublicationSolution presented in this paper combines background modelling, shadow detection and morphological and temporal processing into one system responsible for detection and segmentation of moving objects recorded with a static camera. Vehicles and trains are detected based on their pixellevel difference from the continually updated background model utilizing a Gaussian mixture calculated separately for every pixel. The shadow detection...
-
Zastosowanie urządzeń mobilnych jako platform do implementacji algorytmów przetwarzania strumienia wideo w czasie rzeczywistym
PublicationW niniejszym artykule dokonano krótkiego przeglądu najpopularniejszych systemów operacyjnych dedykowanych dla szeroko pojętych urządzeń mobilnych. Następnie przedstawiono jednoukładowy zestaw uruchomieniowy DevKit8000 z procesorem OMAP3530 oraz z zainstalowaną dystrybucją systemu operacyjnego Linux o nazwie Angstrom. Taka konfiguracja stanowiła platformę mobilną dla implementacji algorytmów przetwarzania i rozpoznawania obrazów...
-
Algorytm ekstrakcji cech biometrycznych twarzy
PublicationW referacie zawarto opis metody automatycznej lokalizacji oraz parametryzacji punktów charakterystycznych w obrazie twarzy. Do lokalizacji punktów charakterystycznych wykorzystano zmodyfikowany algorytm EBGM (ang. Elastic Bunch Graph Matching). Algorytm ten pozwala lokalizować punkty w obrazie przy założeniu niezmienności topologii grafu połączeń między nimi.W referacie przedstawiono podstawy teoretyczne metody oraz zaimplementowany...
-
Mikromocowy procesor analogowy CMOS do wstępnego przetwarzania obrazu
PublicationW artykule przedstawiono scalony analogowy układ wizyjny (ang. vision chip), który wykonuje splotowe niskopoziomowe algorytmy przetwarzania obrazów w czasie rzeczywistym. Układ prototypowy został wykonany w technologii CMOS 0,35 μm i zawiera matrycę SIMD procesorów analogowych o rozmiarze 64 x 64. Wymiary topografii matrycy wynoszą 2,2 mm x 2,2 mm, co daje gęstość 877 procesorów na mm2. Matryca pobiera moc mniejszą niż 0,4 μW (poniżej...
-
Mikromocowy procesor analogowy CMOS do wstępnego przetwarzania obrazu
PublicationW artykule przedstawiono projekt i wyniki badań scalonego analogowego układu wizyjnego, który wykonuje splotowe niskopoziomowe algorytmy przetwarzania obrazu w czasie rzeczywistym. Układ prototypowy został wykonany w technologii CMOS 0,35 μm i zawiera matrycę SIMD procesorów analogowych o rozmiarze 64 x 64. Wymiary topografii matrycy wynoszą 2,2 mm x 2,2 mm, co daje gęstość 877 procesorów na mm2. Matryca pobiera moc mniejszą niż...
-
Lip movement and gesture recognition for a multimodal human-computer interface
Publication -
Indect input to image processing
Publication -
Automatic Tracking with PTZ Cameras
Publication -
Ustomysz
Publication -
New Applications of Multimodal Human-Computer Interfaces
PublicationMultimodal computer interfaces and examples of their applications to education software and for the disabled people are presented. The proposed interfaces include the interactive electronic whiteboard based on video image analysis, application for controlling computers with gestures and the audio interface for speech stretching for hearing impaired and stuttering people. Application of the eye-gaze tracking system to awareness...
-
Metody algorytmicznej analizy obrazu wizyjnego do zastosowań w monitorowaniu ruchu drogowego
PublicationPrzedmiotem badań rozprawy jest opracowanie nowych i rozwinięcie istniejących metod przetwarzania obrazu z kamer wizyjnych systemów monitoringu mających na celu wykrywanie wybranych zdarzeń w ruchu ulicznym. Oznacza to konieczność opracowania, zbadania, implementacji i dostosowania do pracy w określonych warunkach wszystkich niezbędnych do tego celu algorytmów. Obejmują one detekcję i śledzenie obiektów w polu widzenia kamer, reidentyfikację...
-
Wykorzystanie sztucznych sieci neuronowych do wykrywania i rozpoznawania tablic rejestracyjnych na zdjęciach pojazdów
PublicationW artykule przedstawiono koncepcję algorytmu wykrywania i rozpoznawania tablic rejestracyjnych (AWiRTR) na obrazach cyfrowych pojazdów. Detekcja i lokalizacja tablic rejestracyjnych oraz wyodrębnienie z obrazu tablicy rejestracyjnej poszczególnych znaków odbywa się z wykorzystaniem podstawowych technik przetwarzania obrazu (przekształcenia morfologiczne, wykrywanie krawędzi) jak i podstawowych danych statystycznych obiektów wykrytych...
-
Identyfikacja osób na podstawie cech twarzyz zastosowaniem logiki rozmytej
PublicationIstnieje wiele metod identyfikacji twarzyna podstawie zdjęcia, które pomimo swoich licznych zaletcharakteryzują się tym, że prawidłowa identyfikacja zależy odpodobnego w stosunku do zdjęcia znajdującego się w baziedanych oświetlenia, pozy czy miny identyfikowanej osoby.W artykule przedstawiono sposób na usuniecie ograniczeńistniejącego programu identyfikacyjnego Mug-Match Phantomas.Scharakteryzowano również założenia do metodypozwalającej...
-
Combining visual and acoustic modalities to ease speech recognition by hearing impaired people
PublicationArtykuł prezentuje system, którego celem działania jest ułatwienie procesu treningu poprawnej wymowy dla osób z poważnymi wadami słuchu. W analizie mowy wykorzystane zostały parametry akutyczne i wizualne. Do wyznaczenia parametrów wizualnych na podstawie kształtu i ruchu ust zostały wykorzystane modele Active Shape Models. Parametry akustyczne bazują na współczynnikach melcepstralnych. Do klasyfikacji wypowiadanych głosek została...
-
Speech recognition system for hearing impaired people.
PublicationPraca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na...
-
Wykorzystanie analizy obrazu w rozpoznawaniu mowy
PublicationNiniejszy referat przedstawia metodę rozpoznawania mowy na podstawie analizy ruchu ust. W pracy opisano algorytm wyznaczana i śledzenia położenia ust wykorzystujący modele Active Shape Models oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. W pracy umieszczono wyniki klasyfikacji oraz wnioski.
-
Usuwanie niejednolitego tła z obrazów tekstu przy użyciu zmodyfikowanego algorytmu wyostrzania i filtracji nieliniowej
PublicationCelem referatu jest przedstawienie algorytmu poprawy jakości obrazów zawierających tekst na niejednolitym tle. Pierwsza faza realizacji algorytmu obejmuje usunięcie tła poprzez wykorzystanie zmodyfikowanej operacji wyostrzania, w której od oryginalnego obrazu odejmowany jest wynik filtracji dolnoprzepustowej. W tym celu zaproponowano metodę wyznaczenia optymalnej wielkości maski filtru dolnoprzepustowego. W drugiej fazie działania...