Filtry
wszystkich: 279
-
Katalog
- Publikacje 234 wyników po odfiltrowaniu
- Osoby 13 wyników po odfiltrowaniu
- Wynalazki 7 wyników po odfiltrowaniu
- Projekty 6 wyników po odfiltrowaniu
- Laboratoria 1 wyników po odfiltrowaniu
- Zespoły Badawcze 2 wyników po odfiltrowaniu
- Aparatura Badawcza 1 wyników po odfiltrowaniu
- Kursy Online 15 wyników po odfiltrowaniu
Wyniki wyszukiwania dla: AUTOMATYCZNE ROZPOZNAWANIE MOWY
-
Rozpoznawanie dynamicznych i statycznych gestów rąk w zastosowaniu do sterowania aplikacjami komputerowymi
PublikacjaW referacie przedstawiono interfejs, metody oraz algorytmy sterowania komputerem za pomocą dynamicznych i statycznych gestów rąk. Komponentami opracowanego rozwiązania są komputer klasy PC wraz z opracowanym interfejsem i oprogramowaniem, kamera internetowa oraz projektor multimedialny. Gesty rozpoznawane są w procesie analizy obrazu wizyjnego pozyskanego z kamery internetowej przymocowanej do projektora oraz analizy obrazu wyświetlanego...
-
Badanie właściwości sygnału telegraficznego oraz sygnału mowy przesyłanych przez kanał analogowy
PublikacjaW pracy zaprezentowano oprogramowanie TELESOUND, które powstało na potrzeby ćwiczenia pt. "Właściwości źródeł informacji" realizowanego w ramach laboratorium "Podstaw telekomunikacji". W trakcie tego ćwiczenia studenci zapoznają się z podstawowymi pojęciami i mechanizmami funkcjonowania systemów telekomunikacyjnych przekazujących wiadomości na odległość poprzez kanał przestrzenny. Na przykładzie telegrafii i telefonii, studenci...
-
Recognition, understanding and aestheticization of freehand drawing flowcharts
PublikacjaIn this paper a concept of FCA, a system for recognizing, understanding and aestheticization of freehand drawing flow charts is described. The system is based on a proposed by the author FlowGram graph grammar describing flow charts drawing. An open format FlowChartML for flow charts description is also proposed. The aestheticization criterion is formulated that allows for automatic beautification of flow charts. First experiments...
-
Rozpoznawanie ruchów i gestów wykonywanych ustami w obrazie wizyjnym z użyciem sieci neuronowych
PublikacjaUstomysz jest interfejsem komputerowym, umożliwiającym sterowanie kursorem ekranowym za pomocą ruchów ust i gestów wykonywanych ustami. Główną grupą docelową użytkowników interfejsu są osoby, które z dowolnego powodu nie mogą lub nie chcą posługiwać się tradycyjną klawiaturą i myszką komputerową. W związku z tym, może on umożliwić osobom niepełnosprawnym ruchowo, np. z niedowładem kończyn posługiwanie się komputerem, a przez to...
-
Rozpoznawanie cząsteczek substancji smakowych za pomocą oscylatorów z membraną ciekłą zawierających jonowe surfaktanty.
PublikacjaBadano możliwość zastosowania oscylatorów z membraną ciekłą zawierający kationowy (chlorek benzylodimetylotetradecyloamonowy) lub anionowy (oleinian sodu) surfaktant do rozpoznawania substancji odpowiedzialnych za wrażenia smakowe. Wykazano, że charakterystyki oscylacyjne są odmienne dla układów zawierających różne substancje smakowe. Można stwierdzić, że układy badane mogą być stosowane do rozróżniania substancji smakowych.
-
Akustyczny obraz słowa na tle mowy etnicznej [The acoustic image of ethnic speech words]
Publikacja -
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
PublikacjaThis paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
-
Surrogate models and automated cad of passive microwave components
PublikacjaW pracy pokazane zostały techniki modelowania złożonych układów elektronicznych wysokiej częstotliwości. Modele zastępcze mają postać sparametryzowanych modeli matematycznych tworzonych za pomocą schematów interpolacyjnych lub skupionych, pasywnych układów zastępczych dedykowanych analizie w dziedzinie czasu. Do konstrukcji modeli wykorzystywane są wyniki symulacji elektromagnetycznych, co pozwala na osiągnięcie lepszej dokładności...
-
Badanie rozkładów parametrów sygnału mowy w zastosowaniach do prognozowania prawdopodobieństwa popełnienia błędów w systemach identyfikacji mówców = Examining distribution of speech signal parameters for the prognosis of error probability in speaker verification systems
PublikacjaPrzedmiotem pracy jest system identyfikacji mówców w sposób zależny od tekstu ("text dependent''). Dokonano analizy wielu różnych wypowiedzi kilkudziesięciu mówców. Zastosowana metoda parametryzacji to metoda oparta na wynikach analizy cepstralnej sygnału mowy. Zdefiniowane zostały nowe parametry skojarzone z elementarnymi zdarzeniami w procesie weryfikacji mówców. Na tej podstawie dokonano estymacji funkcji gęstości prawdopodobieństwa...
-
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
PublikacjaW pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.
-
A low complexity double-talk detector based on the signal envelope
PublikacjaA new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...
-
Andrzej Czyżewski prof. dr hab. inż.
OsobyProf. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...
-
Gazetteer compression technique based on substructure recognition
PublikacjaAutomaty skończone są najlepszą formą reprezentacji słowników do przetwarzania języka naturalnego. Przedstawiamy nową technikę kompresji, która jest szczególnie użyteczna w stosunku do pewnego rodzaju słowników. Zastępujemy wielokrotnie występujące podstruktury ich niepowtarzalnymi reprezentantami. Do ich znalezienia traktujemy wektor przejść jako tekst i stosujemy technikę kompresji tekstu w stylu Ziv-Lempel, która znajduje powtórzenia...
-
Cyfrowa analiza mowy etnicznej – ekstrakcja kodu informacji [A digital analysis of ethnic speech – deciphering the information code]
Publikacja -
Józef Kotus dr hab. inż.
Osoby -
Metodyka i system dopasowanie protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie.
Publikacja.
-
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych [A system of speech signal processing and visualisation for linguistic purposes]
Publikacja -
Transient detection for speech coding applications
PublikacjaSignal quality in speech codecs may be improved by selecting transients from speech signal and encoding them using a suitable method. This paper presents an algorithm for transient detection in speech signal. This algorithm operates in several frequency bands. Transient detection functions are calculated from energy measured in short frames of the signal. The final selection of transient frames is based on results of detection...
-
Extreme value theory for detecting heavy tails of large claims / Rozpoznawanie grubości ogona rozkładów wielkich roszczeń z użyciem teorii wartości ekstremalnych
Publikacja -
Language material for English audiovisual speech recognition system developmen . Materiał językowy do wykorzystania w systemie audiowizualnego rozpoznawania mowy angielskiej
PublikacjaThe bi-modal speech recognition system requires a 2-sample language input for training and for testing algorithms which precisely depicts natural English speech. For the purposes of the audio-visual recordings, a training data base of 264 sentences (1730 words without repetitions; 5685 sounds) has been created. The language sample reflects vowel and consonant frequencies in natural speech. The recording material reflects both the...
-
Recognition of hazardous acoustic events employing parallel processing on a supercomputing cluster . Rozpoznawanie niebezpiecznych zdarzeń dźwiękowych z wykorzystaniem równoległego przetwarzania na klastrze superkomputerowym
PublikacjaA method for automatic recognition of hazardous acoustic events operating on a super computing cluster is introduced. The methods employed for detecting and classifying the acoustic events are outlined. The evaluation of the recognition engine is provided: both on the training set and using real-life signals. The algorithms yield sufficient performance in practical conditions to be employed in security surveillance systems. The...
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublikacjaIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Piotr Szczuko dr hab. inż.
OsobyDr hab. inż. Piotr Szczuko w 2002 roku ukończył studia na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej zdobywając tytuł magistra inżyniera. Tematem pracy dyplomowej było badanie zjawisk jednoczesnej percepcji obrazu cyfrowego i dźwięku dookólnego. W roku 2008 obronił rozprawę doktorską zatytułowaną "Zastosowanie reguł rozmytych w komputerowej animacji postaci", za którą otrzymał nagrodę Prezesa Rady...
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublikacjaIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
High quality speech codec employing sines+noise+transients model
PublikacjaA method of high quality wideband speech signal representation employing sines+transients+noise model is presented. The need for a wideband speech coding approach as well as various methods for analysis and synthesis of sines, residual and transient states of speech signal is discussed. The perceptual criterion is applied in the proposed approach during encoding of sines amplitudes in order to reduce bandwidth requirements and...
-
Aleksandra Giełdoń - Paszek dr hab.
OsobyDoktor habilitowany w dziedzinie nauk o sztuce, historyk sztuki. Studiowała historię sztuki na Wydziale Filozoficzno-Historycznym Uniwersytetu Jagiellońskiego w Krakowie. W roku 2002 na Wydziale Historycznym tejże uczelni uzyskała tytuł doktora nauk humanistycznych w zakresie nauk o sztuce na podstawie dysertacji: Malarstwo pejzażowe a szkolnictwo artystyczne w Polsce (do 1939 roku). W roku 2015 została doktorem habilitowanym w...
-
Jan Daciuk dr hab. inż.
OsobyJan Daciuk uzyskał tytuł zawodowy magistra na Wydziale Elektroniki Politechniki Gdańskiej w 1986 roku, a doktorat na wydziale Elektroniki, Telekomunikacji i Informatyki PG w 1999. Pracuje na Wydziale od 1988 roku. Jego zainteresowania naukowe obejmują zastosowania automatów skończonych w przetwarzaniu języka naturalnego i przetwarzaniu mowy. Spędził ponad cztery lata w europejskich uniwersytetach i instytutach naukowych, takich...
-
Speech codec enhancements utilizing time compression and perceptual coding
PublikacjaA method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband...
-
Rozpoznawanie uszkodzeń w części przepływowej okrętowego turbinowego silnika spalinowego na podstawie wyników badania endoskopowego = Failures' recognising within the passages of a marine gas turbine engine on the basis of results of endoscopic investigation
PublikacjaThe paper deals with diagnostic issues concerning endoscopic examinations of marine gas turbine engines. There will be presented selected information about failures within the passages and accessible endoscopic methods and means enabling their detection. The author focuses on the endoscopic techniques and widely presents the possibilities of this quickly developed diagnostic method. There will be also presented representative results...
-
Stanisław Szczepański prof. dr hab. inż.
Osoby -
Janusz Górski prof. dr hab. inż.
Osoby -
Rozpoznawanie drukowanej notacji muzycznej z wykorzystaniem bezkonteksto-wych gramatyk atrybutowych.**2002, 139 s. 65 rys. 9 tab. bibliogr. 170 poz. maszyn. Rozprawa doktorska /15.07.2002/ Wydz. ETI. Promotor: doc. dr hab. inż. W. Malina.
Publikacja.
-
Multitask Noisy Speech Enhancement System
PublikacjaW referacie opisano Wielozadaniowy System Poprawy Jakości Sygnału Mowy. Jest to wyspecjalizowany pakiet oprogramowania przeznaczony do rejestrowania sygnału mowy i do poprawy jego jakości oraz zrozumiałości mowy, przy użyciu zaawansowanych procedur cyfrowego przetwarzania sygnału. Pakiet oprogramowania składa się z programów: Rejestrator, Przeglądarka oraz Rekonstruktor. Oprogramowanie to może być użyte w przypadkach, gdy zrozumiałość...
-
New generation speech aid for stuttering people
PublikacjaWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
New generation speech aid for stuttering people
PublikacjaWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language
PublikacjaPrzedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...
-
A system for multitask noisy speech enhancement.
PublikacjaW artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy...
-
Special hearing aid for stuttering people
PublikacjaDzięku postępowi w dziedzienie cyfrowego przetwarzania sygnałów możliwe stało zbudowanie subminiaturowego urządzenia łączącego funkcje aparatu słuchowego i korektora mowy. Takie urządzenie, mimo niewielkich rozmiarów, jest w stanie wykonywać skomplikowane alggorytmy a jego oprogramowanie może być łatwo zmieniane. W pracy skupiono się na zagadnieniach związanych z opracowniem prototypu i implementacją algorytmów korekcji słuchu...
-
Application of hybrid signals processors to speech and hearing aids
PublikacjaDzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...
-
New digital aids for pateints after laryngectomy
PublikacjaPowrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej...
-
Korekta akustyczna sali audytoryjnej Politechniki Śląskiej w Rybniku.
PublikacjaOmówiono korektę akustyczną sali audytoryjnej Politechniki Śląskiej w Rybniku. Przyczyną dokonania korekty była mała zrozumiałość mowy a powodowana nadmierną pogłosowością sali. Rozpatrzono wpływ rezonansu galerii na akustykę sali. Mimo ograniczonej ingerencji w architekturę sali związanej z zabytkowym charakterem budynku, korekta akustyczna znacząco poprawiła zrozumiałość mowy w sali.
-
Rafał Leszczyna dr hab. inż.
OsobyDr hab. inż. Rafał Leszczyna jest profesorem uczelni na Wydziale Zarządzania i Ekonomii Politechniki Gdańskiej. W lipcu 2020 r., na podstawie osiągnięcia naukowego w obszarze zarządzania cyberbezpieczeństwem infrastruktur krytycznych w sektorze elektroenergetycznym, uzyskał stopień doktora habilitowanego w dziedzinie nauk inżynieryjno-technicznych, dyscyplina informatyka techniczna i telekomunikacja. W latach 2004–2008 pracował...
-
System wizyjny sterujący zrobotyzowanym stanowiskiem spawania wymienników ciepła
PublikacjaW pracy przedstawiono system wizyjny, służący do sterowania pracą zrobotyzowanego stanowiska spawania. Zadaniem systemu jest rozpoznawanie spawanego obiektu oraz wygenerowanie odpowiedniej trajektorii palnika robota na podstawie otrzymanej informacji wizyjnej.
-
Quality evaluation of computer aided information retrieval from machine typed paper documents
PublikacjaCelem międzynarodowego projektu memorial jest wspomagane komputerowo rozpoznawanie maszynopisów. Referat prezentuje zagadnienie pomiaru jakości takiego procesu. Wskazano w nim potencjalne miejsca pojawiania się błędów oraz przedstawiono i sklasyfikowano odpowiednie miary.
-
Automatic synthesis of parametric images in dynamic MRI imaging
PublikacjaArtykuł opisuje automatyczne metody czasu dojścia kontrastu (BAT) i tętniczą funkcję wejścia (AIF). Metody te porównano dla klinicznych i symulacyjnych danych.
-
Moje refleksje po ukończeniu 75 lat.
PublikacjaSzkic stanowi streszczenie mowy, jaką wygłosił autor na uroczystości swego 75-lecia.
-
Low-order models from FD-TD time samples
PublikacjaNiniejszy artykuł zawiera opis szeregu kryteriów pozwalających na automatyczne tworzenie wysokiej jakości modeli sygnałów czasowych uzyskanych w drodze symulacji obwodów wysokiej częstotliwości metodą różnic skończonych w dziedzinie czasu. Podany jest szczegółowy opis selekcji kluczowych parametrów modeli takich jak wybór długości ciągu użytego do konstrukcji modeli, współczynnika decymacji silnie nadpróbkowanego przebiegu w dziedzinie...
-
Online pitch estimation using instantaneous complex frequency
PublikacjaW pracy opisano nowe wyniki dotyczące skuteczności algorytmu potokowego estymującego częstotliwość podstawową sygnału mowy. Algorytm wykorzystuje zespoloną pulsację chwilową dla klasyfikacji mowy na dźwięczną i bezdźwięczną oraz estymacji częstotliwości podstawowej dla każdej próbki sygnału. Skuteczność klasyfikacji oraz dokładność estymacji zostały ocenione eksperymentalnie z wykorzystaniem dwóch baz nagrań, zawierających wypowiedzi...
-
Estimation the rhythmic salience of sound with association rules and neural networks
PublikacjaW referacie przedstawiono eksperymenty mające na celu automatyczne wyszukiwanie wartości rytmicznych we frazie muzycznej. W tym celu wykorzystano metody data mining i sztuczne sieci neuronowe.
-
Ewa Hermanowicz prof. dr hab. inż.
Osoby