Filters
total: 485
-
Catalog
- Publications 348 available results
- People 19 available results
- Inventions 3 available results
- Projects 7 available results
- Laboratories 1 available results
- Research Teams 1 available results
- Research Equipment 1 available results
- e-Learning Courses 23 available results
- Events 2 available results
- Open Research Data 80 available results
Search results for: ROZPOZNAWANIE TEKSTU I OBRAZU
-
Piotr Szczuko dr hab. inż.
PeoplePiotr Szczuko received his M.Sc. degree in 2002. His thesis was dedicated to examination of correlation phenomena between perception of sound and vision for surround sound and digital image. He finished Ph.D. studies in 2007 and one year later completed a dissertation "Application of Fuzzy Rules in Computer Character Animation" that received award of Prime Minister of Poland. His interests include: processing of audio and video, computer...
-
Analiza przydatności wybranych współczynników kształtu do oceny podobieństwa do litery
PublicationPrzedstawiono analizę przydatności wybranych współczynników kształtu w celu zastosowania ich w metodzie oceny podobieństwa kształtu do litery, opartej o segmentację obrazu. Opracowane algorytmy zaimplementowano do ekstrakcji i rozpoznawanie tekstu z obrazów zarejestrowanych kamerą lub aparatem cyfrowym w naturalnym otoczeniu. Rozpoznany tekst może zostać zamieniony na postać mówioną w urządzeniach wspomagających osoby niewidome.
-
Józef Kotus dr hab. inż.
People -
Applications of knowledge technologies to sound and vision engineering
PublicationSpecjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w...
-
Performance Analysis of Developed Multimodal Biometric Identity Verification System
PublicationThe bank client identity verification system developed in the course of the IDENT project is presented. The total number of five biometric modalities including: dynamic handwritten signature proofing, voice recognition, face image verification, face contour extraction and hand blood vessels distribution comparison have been developed and studied. The experimental data were acquired employing multiple biometric sensors installed...
-
Application of colour image segmentation for localization and extraction text from images
PublicationW otaczającym nas świecie informacja tekstowa odgrywa wielką rolę. W postaci tekstowej podawane są: nazwy ulic, nazwy sklepów i instytucji, opisy przedmiotów np. tytuły książek, opakowań itp. Jednocześnie współczesne programy komputerowe służące do rozpoznawania tekstu (OCR) ''nie radzą sobie'' z analizą obrazów otrzymanaych za pomocą kamer. Segmentacja obrazu z następującą kontekstową analizą parametrów segmentów może dostarczyć...
-
Wykorzystanie sztucznych sieci neuronowych do wykrywania i rozpoznawania tablic rejestracyjnych na zdjęciach pojazdów
PublicationW artykule przedstawiono koncepcję algorytmu wykrywania i rozpoznawania tablic rejestracyjnych (AWiRTR) na obrazach cyfrowych pojazdów. Detekcja i lokalizacja tablic rejestracyjnych oraz wyodrębnienie z obrazu tablicy rejestracyjnej poszczególnych znaków odbywa się z wykorzystaniem podstawowych technik przetwarzania obrazu (przekształcenia morfologiczne, wykrywanie krawędzi) jak i podstawowych danych statystycznych obiektów wykrytych...
-
Multimedialny interfejs cienkiego klienta dla osób niepełnosprawnych w systemie informacyjnym GDASKON
PublicationPo krótkiej dyskusji wymagań stawianych interfejsom przeznaczonym dla ludzi niepełnosprawnych artykuł przedstawia przykładowy interfejs zaprojektowany dla osób o różnym rodzaju niesprawności i zrealizowany dla telefonów komórkowych i palmtopów z przeznaczeniem do zdalnego korzystania z systemu informacyjnego GDASKON, służącego do znajdowania trasy między dwoma punktami w terenie. Zastosowane rozwiązanie polega na odpowiedniej adaptacji...
-
Integracyjna architektura systemu monitorowania terenu Politechniki Gdańskiej
PublicationW rozdziale przedstawiono zastosowanie integracyjnej metodywytwarzania aplikacji w systemie monitorowania bezpieczeństwa przestrzeni publicznej. Została opisana architektura i proces wytwórczy systemu Monitoring PG, który umożliwia automatyczne rozpoznawanie niebezpieczeństw oraz przesyłanie informacji do odpowiednich służb. Podczas realizacji systemu zaproponowano systematyczny opis interfejsów integrowanych usług obejmującyspecyfikacje...
-
Zdalne rozpoznawanie twarzy w poprawie bezpieczeństwa osobistego interweniującego funkcjonariusza Policji
PublicationStreszczenie: W 2017 r. ruszył w Polsce pilotażowy program zakładania kamer cyfrowych na mundurach policyjnych. Z perspektywy dnia dzisiejszego wiadomo, że kamery będące indywidualnym wyposażeniem policjanta, rejestrując czas, datę i przebieg interwencji, niejednokrotnie stanowią istotny dowód w sprawach spornych, zwłaszcza w sytuacjach pomawiania policjantów o przekroczenie uprawnień podczas interwencji. W dobie nieustannie...
-
Wykorzystanie nowych metod wnioskowania w grafice i animacji komputerowej
PublicationReferat opisuje realizowane zadania badawcze, dotyczące wykorzystana nowych metod wnioskowania (tzw. soft-computingu) w przetwarzaniu grafiki i animacji komputerowej. W pierwszym z zadań, opracowaniu metody poprawy jakości fotografii tekstu przeznaczonych do rozpoznawania znaków, wykorzystano algorytmy przetwarzania obrazów i ich modyfikacje do usuwania ze zdjęcia tła oraz gradientu jasności, następnie nowa metoda filtracji nieliniowej...
-
Usuwanie odblasków linii laserowej
PublicationW nowoczesnych zrobotyzowanych systemach produkcyjnych coraz częściej stosuje się różnego rodzaju czujniki montowane na ramieniu robota, umożliwiające automatyczne rozpoznawanie położenia i kształtu obiektów znajdujących się w polu roboczym. Pozwala to na adaptacyjne dostosowywanie procesu technologicznego do zaistniałej sytuacji. Wyposażając robota w kamerę oraz linijkę laserową możliwe jest stworzenie zrobotyzowanego skanera...
-
Lokalizacja tekstu w obrazie
PublicationW naturalnym otoczeniu człowieka znajduje się duża ilość łatwo rozpoznawalnej informacji przedstawionej w postaci znaków graficznych i tekstu. Informacja taka jest bardzo przydatna w poruszaniu się w środowisku miejskim. Niestety, osoby z upośledzonymi funkcjami wzroku w sposób oczywisty pozbawione są możliwości korzystania z tego rodzaju przekazu. Istniejące na rynku systemy rozpoznawania tekstu (OCR) nie są niestety dostosowane...
-
Klasyfikacja tekstu przy użyciu grafowych sieci neuronowych
PublicationWspółczesnym algorytmom analizy tekstu wciąż daleko do ludzkiego poziomu jego zrozumienia. Jednym z wyzwań jest znajdowanie przez maszynę związków pomiędzy odległymi fragmentami tekstu. Próbą rozwiązania tego problemu są grafowe reprezentacje tekstu, które bardzo dobrze sprawdzają się w przedstawianiu złożonych zależności. W tekście opisane zostały dwie metody grafowej reprezentacji tekstu oraz algorytm grafowych konwolucyjnych...
-
Generowanie tekstu z użyciem sieci typu Transformer
PublicationOpisano działanie wybranych modeli uczenia maszynowego znajdujących zastosowanie w przetwarzaniu języka naturalnego w szczególności wy- korzystywanych do generowania tekstu. Przedstawiono również model BERT i jego różne wersje, a także praktyczne wykorzystanie modeli typu Transformer. Przedstawiono ich działanie w aplikacji zmieniającej nastrój tekstu w sposób sekwencyjny.
-
Identyfikacja na podstawie pisma i tekstu
PublicationW pracy zamieszczono opis różnych technik identyfikacji tożsamości na podstawie pisma, tekstu i podpisów. Omówiono algorytmy ekstrakcji cech niezbędne do wykonania operacji rozpoznawania. Opisane systemy biometryczne odgrywają dużą rolę w identyfikacji i weryfikacji osobniczej.
-
Rozpoznawanie osób i zdarzeń: Zakres badań
PublicationRozpoznawanie osób i zdarzeń, analiza strumieni wielomadalnych, cyfrowe przetwarzanie sygnałów.
-
Rozpoznawanie osób i zdarzeń: Charakterystyka algorytmów
PublicationRozpoznawanie osób i zdarzeń, analiza strumieni wielomadalnych, cyfrowe przetwarzanie sygnałów.
-
Rozpoznawanie osób i zdarzeń: Ocena jakościowa aplikacji
PublicationRozpoznawanie osób i zdarzeń, analiza strumieni wielomadalnych, cyfrowe przetwarzanie sygnałów.
-
Percepcja dźwięku i obrazu - 2023_2024
e-Learning CoursesWykład dla sem. I - studia mgr WETI, kier. EiT, specj. Inżynieria dźwięku i obrazu. Celem przedmiotu jest zapoznanie studentów z zagadnieniami leżącymi u podstaw percepcji dźwięku i obrazu, a także metodami badania słuchu i wzroku
-
Wizualizacja obrazu stereowizyjnego w systemie VISROBOT
PublicationArtykuł opisuje nowe podejście do robotycznego systemu wizyjnego, którego zadaniem jest wizualizacja obrazu stereo dla operatora robota. Pomysł ten zasadza się na inteligentnym wykorzystaniu zmiennej bazy stereo, która pozwala na zwiększenie zakresu rozdzielczości głębi obrazu dla odległych obiektów. W systemie takim na podstawie obrazu stereo, przy różnych bazach, wyznaczana jest mapa dysparycji. Odpowiednia wizualizacja (zakresu)...
-
Wizualizacja obrazu stereowizyjnego w systemie VisRobot
PublicationW pracy omawia się nowe podejście do robotycznego systemu wizyjnego, którego zadaniem jest wizualizacja obrazu stereo dla operatora robota. Pomysł ten polega na inteligentnym wykorzystaniu zmiennej bazy stereo, co pozwala na zwiększenie zakresu rozdzielczości głębi obrazu dla odległych obiektów. W systemie VisRobot na podstawie obrazu stereo, przy różnych bazach, wyznaczana jest mapa dysparycji. Odpowiednia wizualizacja (zakresu)...
-
Rozpoznawanie osób i zdarzeń: Opis aplikacji rozpoznawania obiektów i zdarzeń
PublicationRozpoznawanie osób i zdarzeń, analiza strumieni wielomadalnych, cyfrowe przetwarzanie sygnałów.
-
Synteza i obróbka obrazu - 2023
e-Learning CoursesKurs dla studentów semestru 3 studiów 2. stopnia, Inżynieria Dźwięku i Obrazu. Prowadzący: dr hab. inż. Grzegorz Szwoch
-
Synteza i obróbka obrazu - 2022
e-Learning CoursesKurs dla studentów semestru 3 studiów 2. stopnia, Inżynieria Dźwięku i Obrazu. Prowadzący: dr hab. inż. Grzegorz Szwoch
-
Synteza i obróbka obrazu 2024
e-Learning CoursesKurs dla studentów semestru 3 studiów 2. stopnia, Inżynieria Dźwięku i Obrazu. Prowadzący: dr hab. inż. Grzegorz Szwoch
-
Komputerowa analiza obrazu w inzynierii materiałowej.
PublicationPraca prezentuje podstawowe pojęcia i przekształcenia stosowane w komputerowej analizie obrazu oraz przedstawia mozliwości wykorzystania jej w inżynierii materiałowej.
-
Rozpoznawanie obiektów przez głębokie sieci neuronowe
PublicationW referacie zaprezentowane zostaną wyniki badań nad rozpoznawaniem obiektów w różnych warunkach za pomocą głębokich sieci neuronowych. Przeanalizowano działanie dwóch struktur – ResNet50 oraz VGG19. Systemy rozpoznawania obrazu wytrenowano oraz przetestowano na reprezentatywnej, bazie zawierającej 25 tys. zdjęć psów oraz kotów, która znacznie upraszcza analizowanie działania systemów ze względu na łatwość interpretacji zdjęć przez...
-
Rozpoznawanie notacji muzycznej
PublicationW rozdziale przedstawiono najważniejsze problemy występujące w systemach OMR oraz przykładowe podejścia do ich rozwiązania.
-
implementacja algorytmu stabilizacji obrazu z kamery w układzie FPGA
PublicationW systemach monitorujących ruch uliczny wykorzystywane są algorytmy wstępnego przetwarzania obrazu takie jak: filtracji, kompresji oraz stabilizacji. Algorytmom tym stawiane są następujące wymagania: praca w czasie rzeczywistym, minimalna moc pobierana ze źródła zasilania (systemy zasilane bateryjnie), zajmowanie niewielkich zasobów sprzętowych (układy FPGA czy CPLD) oraz wykonywanie jedynie podstawowych operacji arytmetycznych...
-
Obróbka graficzna obrazu w nowoczesnych systemach diagnostyki sieci trakcyjnej jezdnej
PublicationW artykule autorzy przedstawiają założenia nowej metody bezkontaktowego pomiaru położenia przewodów jezdnych sieci trakcyjnej, a także pokazują jakie znaczenie w tej metodzie ma komputerowa analiza obrazu pozyskiwanego z kamery. Problemem technik wizyjnych jest zmienność parametrów obrazu wejściowego (jasność, kontrast, zakres widma, krzywa gamma i in.), które są zależne od zmieniających się warunków oświetlenia zewnętrznego związanych...
-
Usuwanie niejednolitego tła z obrazów tekstu przy użyciu zmodyfikowanego algorytmu wyostrzania i filtracji nieliniowej
PublicationCelem referatu jest przedstawienie algorytmu poprawy jakości obrazów zawierających tekst na niejednolitym tle. Pierwsza faza realizacji algorytmu obejmuje usunięcie tła poprzez wykorzystanie zmodyfikowanej operacji wyostrzania, w której od oryginalnego obrazu odejmowany jest wynik filtracji dolnoprzepustowej. W tym celu zaproponowano metodę wyznaczenia optymalnej wielkości maski filtru dolnoprzepustowego. W drugiej fazie działania...
-
Pikselowy cyfrowy układ CDS przeznaczony do przetwornika obrazu CMOS
PublicationW artykule zaproponowano cyfrowy układ CDS (Correlated Double Sampling) przeznaczony do przetwornika obrazu CMOS. Układ różni się od klasycznych rozwiązań tym, że dwie pamięci przechowujące próbki sygnału wizyjnego zastąpiono jednym licznikiem rewersyjnym. Dzięki tej modyfikacji możliwa jest znaczna redukcja powierzchni układu CDS i umieszczenie go w każdym pikselu przetwornika obrazu CMOS. System został zaprojektowany i przesymulowany...
-
Pikselowy cyfrowy układ CDS przeznaczony do przetwornika obrazu CMOS
PublicationW artykule zaproponowano cyfrowy układ CDS (Correlated Double Sampling) przeznaczony do przetwornika obrazu CMOS. Układ różni się od klasycznych rozwiązań tym, że dwie pamięci przechowujące próbki sygnału wizyjnego zastąpiono jednym licznikiem rewersyjnym. Dzięki tej modyfikacji możliwa jest znaczna redukcja powierzchni układu CDS i umieszczenie go w każdym pikselu przetwornika obrazu CMOS. System został zaprojektowany i przesymulowany...
-
Zastosowanie metody analizy obrazu w określaniu odporności kawitacyjnej materiałów
PublicationPrzedstawiono optyczną metodę określania właściwości kawitacyjnych materiału oraz charakterystyki kawitacyjnej stanowiska przy zastosowaniu komputerowej analizy obrazu erodowanej powierzchni uzyskanego w mikroskopie świetlnym.
-
Rozpoznawanie kategorii ruchu ludzkiego na podstawie analizy sygnałów pochodzących z trójosiowych czujników przyspieszenia
PublicationW artykule przedstawiono procedurę rejestracjisygnałów przyspieszenia pochodzących z czujnikówbiomedycznych Shimmer, sposób ich rozmieszczenia na ciele orazopisano klasyfikator pozwalający na rozpoznawanie wybranychkategorii ruchu ludzkiego. W części eksperymentalnej artykułuzbadano wpływ filtracji dolnoprzepustowej sygnałów naskuteczność rozpoznawania typu aktywności ruchowej.
-
Automatyczna georeferencja w oparciu o rozpoznawanie i dopasowywanie niejednorodnych zbiorów punktów
PublicationW pracy przedstawiono kształt prototypowego systemu przeznaczonego do przeprowadzania automatycznej georeferencji obrazów pozyskiwanych na drodze obserwacji lotniczej lub satelitarnej. System przewiduje przeprowadzanie georeferencji w trybie nienadzorowanym w oparciu o rozpoznawanie i dopasowywanie kształtów o charakterze zbiorów punktów. Omówiono komponenty oraz zaproponowano algorytmy możliwe do zastosowania w poszczególnych...
-
Wprowadzenie do analizy obrazu w procesie detekcji i identyfikacji twarzy
PublicationOpisano proces analizy obrazu na podstawie biometrycznych metod rozpoznawania twarzy. Przedstawiono algorytm detekcji oraz identyfikacji człowieka na podstawie punktów charakterystycznych twarzy oraz opisano szczegółowo jego etapy. Zdefiniowano pojęcia: biometria, proces pomiaru biometrycznego, analiza obrazu. Przedstawiono wybrane, istniejące systemy monitoringu wykorzystujące algorytmy wypracowane na podstawie biometrycznych...
-
Klasyfikacja segmentów obrazu na litery i nielitery
PublicationArtykuł przedstawia metody oceny podobieństwa figur do liter opracowane dla potrzeb urządzenia do lokalizacji i odczytu napisów z przeznaczeniem dla osób niewidomych. Ocena dotyczy kształtów segmentów znajdowanych na obrazie zawierającym potencjalny tekst (np. witryna sklepu, drzwi z wizytówką, autobus z numerem linii). Celem tej oceny jest wyodrębnienie segmentów obrazu reprezentujących tekst i przekazanie ich do systemu rozpoznawania...
-
Mikromocowy procesor analogowy CMOS do wstępnego przetwarzania obrazu
PublicationW artykule przedstawiono projekt i wyniki badań scalonego analogowego układu wizyjnego, który wykonuje splotowe niskopoziomowe algorytmy przetwarzania obrazu w czasie rzeczywistym. Układ prototypowy został wykonany w technologii CMOS 0,35 μm i zawiera matrycę SIMD procesorów analogowych o rozmiarze 64 x 64. Wymiary topografii matrycy wynoszą 2,2 mm x 2,2 mm, co daje gęstość 877 procesorów na mm2. Matryca pobiera moc mniejszą niż...
-
Detekcja obrazu pojazdów w nagraniach wideo oraz eliminacja pasożytniczych sprzężeń akustycznych
PublicationReferat prezentuje dwa niezależne rozwiązania z dziedziny inżynierii dźwięku i obrazu. Pierwsze z nich dotyczy wykrywania obrazu ruchomych pojazdów w nagraniach wideo dla zastosowań w monitoringu ruchu drogowego. Detekcja pojazdów odbywa się poprzez porównanie bieżącej ramki obrazu z modelem tła tworzonym w oparciu o sumę ważoną funkcji Gaussowskich. Zbadano skuteczność tej metody w oparciu o przykładowe nagrania ruchu ulicznego....
-
Prosty komparator analogowy dla cyfrowego przetwornika obrazu CMOS
PublicationKomparator napięciowy, oprócz przetwornika światło-napięcie, jest jedynym elementem analogowym w cyfrowym pikselu CMOS. W pracy badano wpływ nieidealności komparatora analogowego na parametry cyfrowego piksela. W tym celu zaprojektowano w technologii CMOS 0,35μm dwie wersje cyfrowego piksela, różniące się typem zastosowanego komparatora analogowego. W pierwszej wersji piksela zastosowano różnicowy komparator o zwiększonej powierzchni...
-
Rozpoznawanie dynamicznych i statycznych gestów rąk w zastosowaniu do sterowania aplikacjami komputerowymi
PublicationW referacie przedstawiono interfejs, metody oraz algorytmy sterowania komputerem za pomocą dynamicznych i statycznych gestów rąk. Komponentami opracowanego rozwiązania są komputer klasy PC wraz z opracowanym interfejsem i oprogramowaniem, kamera internetowa oraz projektor multimedialny. Gesty rozpoznawane są w procesie analizy obrazu wizyjnego pozyskanego z kamery internetowej przymocowanej do projektora oraz analizy obrazu wyświetlanego...
-
Realizacja przetwornika obrazu CMOS z wbudowaną konwersją A/C i cyfrowym układem CDS
PublicationW artykule przedstawiono realizację w technologii CMOS 180 nm przetwornika obrazu z wbudowaną konwersją analogowo-cyfrową oraz z funkcją cyfrowej redukcji szumu. Przedstawiona realizacja przetwornika obrazu różni się od znanych z literatury rozwiązań tym, że układ redukcji szumu CDS (Correlated Double Sampling) umieszczono w każdym pikselu obrazu. Dzięki tej modyfikacji możliwe jest zastąpienie migawki szczelinowej przez migawkę...
-
Prosty komparator analogowy dla cyfrowego przetwornika obrazu CMOS
PublicationKomparator napięciowy, oprócz przetwornika światło-napięcie, jest jedynym elementem analogowym w cyfrowym pikselu CMOS. W pracy badano wpływ nieidealności komparatora analogowego na parametry cyfrowego piksela. W tym celu zaprojektowano w technologii CMOS 0,35 µm dwie wersje cyfrowego piksela, różniące się typem zastosowanego komparatora analogowego. W pierwszej wersji piksela zastosowano różnicowy komparator o zwiększonej powierzchni...
-
Implementacja w FPGA algorytmu detekcji krawędzi obrazu w czasie rzeczywistym
PublicationW artykule przedstawiono projekt architektury oraz implementację układową toru przetwarzania wstępnego obrazu z modułem detekcji krawędzi. Układ został zaimplementowany w FPGA Intel Cyclone. Zrealizowany moduł wykorzystuje pięć wybranych algorytmów wykrywania krawędzi, w tym Robertsa, Sobela i Prewitt.
-
Rozpoznawanie oraz lokalizacja w obrazie przewodów linii wysokiego napięcia
PublicationW pracy przedstawiono opracowany algorytm rozpoznawania oraz lokalizacji przewodów linii wysokiego napięcia na podstawie obrazu horyzontalnego. Procedura detekcji przewodu została podzielona na trzy etapy. Pierwszy etap zawiera algorytm wykrywania krawędzi wykazujący największą czułość na krawędzie poziome, a jednocześnie brak czułości na krawędzie pionowe. Efektem jest znaczna redukcja liczby wykrytych krawędzi w porównaniu do...
-
Zastosowanie zachowującej kolor segmentacji obrazu barwnego do wyszukiwania obszarów zawierających tekst.
PublicationW pracy opisana została metoda segmentacji obrazów barwnych dedykowana do rozpoznawania obszarów zawierających tekst oraz przedstawiona została metoda kontekstowej analizy przetworzonego obrazu.
-
Rozpoznawanie ruchu rąk oraz chodu pacjentów na podstawie analizy sygnałów pochodzących z trójosiowych czujników przyspieszenia
PublicationW pracy przedstawiono eksperymenty związane z automatyczną klasyfikacją i rozpoznawaniem aktywności pacjentów z chorobą Parkinsona. W szczególności opisano algorytmy, mające na celu rozpoznawanie dwóch kategorii ruchu: ruchu rąk oraz chodu. Aktywności te wykrywane są na podstawie analizy sygnałów pochodzących z trójosiowych akcelerometrów umieszczonych na ciele osoby badanej.
-
Sprzętowo - programowa analiza obrazu otrzymanego z detektora obiektów ruchomych
PublicationW artykule przedstawiono budowę wewnętrzną oraz zasadę działania sprzętowo - programowego bloku realizującego analizę danych z obrazowego detektora ruchu. System zrealizowano za pomocą 2 identycznych procesorów 8-bitowych pracujących synchronicznie, jednego 32-bitowego procesora typu BA12 [4] oraz zestawu tablic pamięci. Algorytm analizy obrazu jest dwuetapowy. W pierwszym etapie następuje transformacja geometryczna umoŜliwiająca...