Filters
total: 275
filtered: 230
-
Catalog
Chosen catalog filters
Search results for: AUTOMATYCZNE ROZPOZNAWANIE MOWY
-
Language material for English audiovisual speech recognition system developmen . Materiał językowy do wykorzystania w systemie audiowizualnego rozpoznawania mowy angielskiej
PublicationThe bi-modal speech recognition system requires a 2-sample language input for training and for testing algorithms which precisely depicts natural English speech. For the purposes of the audio-visual recordings, a training data base of 264 sentences (1730 words without repetitions; 5685 sounds) has been created. The language sample reflects vowel and consonant frequencies in natural speech. The recording material reflects both the...
-
Recognition of hazardous acoustic events employing parallel processing on a supercomputing cluster . Rozpoznawanie niebezpiecznych zdarzeń dźwiękowych z wykorzystaniem równoległego przetwarzania na klastrze superkomputerowym
PublicationA method for automatic recognition of hazardous acoustic events operating on a super computing cluster is introduced. The methods employed for detecting and classifying the acoustic events are outlined. The evaluation of the recognition engine is provided: both on the training set and using real-life signals. The algorithms yield sufficient performance in practical conditions to be employed in security surveillance systems. The...
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublicationIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
PublicationIn this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
-
High quality speech codec employing sines+noise+transients model
PublicationA method of high quality wideband speech signal representation employing sines+transients+noise model is presented. The need for a wideband speech coding approach as well as various methods for analysis and synthesis of sines, residual and transient states of speech signal is discussed. The perceptual criterion is applied in the proposed approach during encoding of sines amplitudes in order to reduce bandwidth requirements and...
-
Speech codec enhancements utilizing time compression and perceptual coding
PublicationA method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband...
-
Rozpoznawanie uszkodzeń w części przepływowej okrętowego turbinowego silnika spalinowego na podstawie wyników badania endoskopowego = Failures' recognising within the passages of a marine gas turbine engine on the basis of results of endoscopic investigation
PublicationThe paper deals with diagnostic issues concerning endoscopic examinations of marine gas turbine engines. There will be presented selected information about failures within the passages and accessible endoscopic methods and means enabling their detection. The author focuses on the endoscopic techniques and widely presents the possibilities of this quickly developed diagnostic method. There will be also presented representative results...
-
Rozpoznawanie drukowanej notacji muzycznej z wykorzystaniem bezkonteksto-wych gramatyk atrybutowych.**2002, 139 s. 65 rys. 9 tab. bibliogr. 170 poz. maszyn. Rozprawa doktorska /15.07.2002/ Wydz. ETI. Promotor: doc. dr hab. inż. W. Malina.
Publication.
-
Multitask Noisy Speech Enhancement System
PublicationW referacie opisano Wielozadaniowy System Poprawy Jakości Sygnału Mowy. Jest to wyspecjalizowany pakiet oprogramowania przeznaczony do rejestrowania sygnału mowy i do poprawy jego jakości oraz zrozumiałości mowy, przy użyciu zaawansowanych procedur cyfrowego przetwarzania sygnału. Pakiet oprogramowania składa się z programów: Rejestrator, Przeglądarka oraz Rekonstruktor. Oprogramowanie to może być użyte w przypadkach, gdy zrozumiałość...
-
New generation speech aid for stuttering people
PublicationWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
New generation speech aid for stuttering people
PublicationWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...
-
Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language
PublicationPrzedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...
-
A system for multitask noisy speech enhancement.
PublicationW artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy...
-
Special hearing aid for stuttering people
PublicationDzięku postępowi w dziedzienie cyfrowego przetwarzania sygnałów możliwe stało zbudowanie subminiaturowego urządzenia łączącego funkcje aparatu słuchowego i korektora mowy. Takie urządzenie, mimo niewielkich rozmiarów, jest w stanie wykonywać skomplikowane alggorytmy a jego oprogramowanie może być łatwo zmieniane. W pracy skupiono się na zagadnieniach związanych z opracowniem prototypu i implementacją algorytmów korekcji słuchu...
-
Application of hybrid signals processors to speech and hearing aids
PublicationDzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...
-
New digital aids for pateints after laryngectomy
PublicationPowrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej...
-
Korekta akustyczna sali audytoryjnej Politechniki Śląskiej w Rybniku.
PublicationOmówiono korektę akustyczną sali audytoryjnej Politechniki Śląskiej w Rybniku. Przyczyną dokonania korekty była mała zrozumiałość mowy a powodowana nadmierną pogłosowością sali. Rozpatrzono wpływ rezonansu galerii na akustykę sali. Mimo ograniczonej ingerencji w architekturę sali związanej z zabytkowym charakterem budynku, korekta akustyczna znacząco poprawiła zrozumiałość mowy w sali.
-
System wizyjny sterujący zrobotyzowanym stanowiskiem spawania wymienników ciepła
PublicationW pracy przedstawiono system wizyjny, służący do sterowania pracą zrobotyzowanego stanowiska spawania. Zadaniem systemu jest rozpoznawanie spawanego obiektu oraz wygenerowanie odpowiedniej trajektorii palnika robota na podstawie otrzymanej informacji wizyjnej.
-
Automatic synthesis of parametric images in dynamic MRI imaging
PublicationArtykuł opisuje automatyczne metody czasu dojścia kontrastu (BAT) i tętniczą funkcję wejścia (AIF). Metody te porównano dla klinicznych i symulacyjnych danych.
-
Quality evaluation of computer aided information retrieval from machine typed paper documents
PublicationCelem międzynarodowego projektu memorial jest wspomagane komputerowo rozpoznawanie maszynopisów. Referat prezentuje zagadnienie pomiaru jakości takiego procesu. Wskazano w nim potencjalne miejsca pojawiania się błędów oraz przedstawiono i sklasyfikowano odpowiednie miary.
-
Low-order models from FD-TD time samples
PublicationNiniejszy artykuł zawiera opis szeregu kryteriów pozwalających na automatyczne tworzenie wysokiej jakości modeli sygnałów czasowych uzyskanych w drodze symulacji obwodów wysokiej częstotliwości metodą różnic skończonych w dziedzinie czasu. Podany jest szczegółowy opis selekcji kluczowych parametrów modeli takich jak wybór długości ciągu użytego do konstrukcji modeli, współczynnika decymacji silnie nadpróbkowanego przebiegu w dziedzinie...
-
Moje refleksje po ukończeniu 75 lat.
PublicationSzkic stanowi streszczenie mowy, jaką wygłosił autor na uroczystości swego 75-lecia.
-
Online pitch estimation using instantaneous complex frequency
PublicationW pracy opisano nowe wyniki dotyczące skuteczności algorytmu potokowego estymującego częstotliwość podstawową sygnału mowy. Algorytm wykorzystuje zespoloną pulsację chwilową dla klasyfikacji mowy na dźwięczną i bezdźwięczną oraz estymacji częstotliwości podstawowej dla każdej próbki sygnału. Skuteczność klasyfikacji oraz dokładność estymacji zostały ocenione eksperymentalnie z wykorzystaniem dwóch baz nagrań, zawierających wypowiedzi...
-
Estimation the rhythmic salience of sound with association rules and neural networks
PublicationW referacie przedstawiono eksperymenty mające na celu automatyczne wyszukiwanie wartości rytmicznych we frazie muzycznej. W tym celu wykorzystano metody data mining i sztuczne sieci neuronowe.
-
Automated design of waveguide filters with frequency-dependent couplings.
PublicationW artykule zaproponowano szybką technikę pozwalającą na automatyczne projektowanie filtrów falowodowych ze sprzężeniami zależnymi od częstotliwości. Procedura optymalizacyjna jest trójetapowa z różnymi funkcjami celu w każdym etapie.
-
Strategie treningu neuronowego estymatora częstotliwości tonu krtaniowego z użyciem generatora syntetycznych samogłosek
PublicationW wielu zastosowaniach telekomunikacyjnych pojawia się problem przetwarzania lub analizy sygnału mowy, w ramach którego, często w obszarze podstawowych algorytmów, stosuje się estymator częstotliwości tonu krtaniowego. Estymator rozpatrywany w tej pracy bazuje na neuronowym klasyfikatorze podejmującym decyzje na podstawie częstotliwości oraz mocy chwilowej wyznaczanych w podpasmach analizowanego sygnału mowy. W pracy rozważamy...
-
Registration and normalization of MRI/PET images
PublicationW artykule przedstawiono technikę rejestracji i normalizacji obrazów MRI/PET. Zawiera on porównanie sztywnej i elastycznej transformacji gemotrycznej. Porownano w nim rowniez manualne i proponowane automatyczne podejscie do problemu rejestracji i normalizacji obrazow.
-
Advanced speech archiving and restoration system for aviation applications
PublicationW referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów - jest to niezwykle istotne w...
-
Komputerowy system sieciowy wspomagający ocenianie uczniów
PublicationW referacie przedstawiono funkcje użytkowe sieciowego systemu komputerowego umożliwiające utworzenie przez nauczycieli testów wyboru z dowolnej dziedziny, przeprowadzenie lekcji polegającej na rozwiązywaniu testów, automatyczne ocenianie rozwiązań, sporządzanie statystyk oraz powiadamianie uczniów o wynikach testów.
-
Automatic retrieval of musical rhythmic patterns.
PublicationObecnie stosowane technologie pozwalają na wyszukiwanie muzyki w zasobach Internetowych w oparciu o reprezentację melodyczną. W referacie przedstawiono problemy związane z wyszukiwaniem cech rytmicznych utworów muzycznych i pokazano stosowane metody umożliwiające automatyczne określanie rytmu.
-
Nowy algorytm regulacji transformatorów zasilających sieć rozdzielczą
PublicationW niniejszym artykule opisano przykład nowego inteligentnegoalgorytmu regulatora transformatora. Układregulacji transformatorów 110/SN, z proponowanym algorytmemdziałania, umożliwia automatyczne dostosowaniealgorytmu działania regulatorów do aktualnych stanówsystemu elektroenergetycznego (np. lawina napięcia)i w ten sposób może wpłynąć na wzrost bezpieczeństwaelektroenergetycznego.
-
Cifrovaâ reprezentaciâ leksem russkogo âzyka
PublicationKonfrontowanie zasobów leksyki pokrewnych systemów języka etnicznego w celu określenia stopnia zbieżności przynależnych im homonimik wymaga stosowania wysublimowanych procedur językoznawczych mających na celu oszacowanie wspólnoty akustycznej zawartej w paralelnych parlacjach użytkowników owych języków. Ewidentne zróżnicowanie nawyków aktu artykulacji a zwłaszcza, co szczególnie istotne, nieświadomego procesu intelektualnej percepcji...
-
Performance Analysis of Developed Multimodal Biometric Identity Verification System
PublicationThe bank client identity verification system developed in the course of the IDENT project is presented. The total number of five biometric modalities including: dynamic handwritten signature proofing, voice recognition, face image verification, face contour extraction and hand blood vessels distribution comparison have been developed and studied. The experimental data were acquired employing multiple biometric sensors installed...
-
Nowe metody przetwarzania sygnałów w wybranych zagadnieniach wibroakustyki
PublicationMonografia Nowe Metody Przetwarzania Sygnałów w Wybranych Zagadnieniach Wibroakustyki będąca piętnastym Tomem z serii Monografie Katedry Automatyzacji Procesów AGH w Krakowie poświęcona jest zagadnieniom związanym z zastosowaniem i wykorzystaniem metod przetwarzania sygnałów wibroakustycznych w wybranych problemach technicznych i medycznych. W pierwszym rozdziale niniejszej monografii przedstawiono zagadnienia dotyczące metod przetwarzania...
-
Circular saw teeth control with vision method
PublicationOpisano automatyczne urządzenie do automatycznego sprawdzania geometrii pił tarczowych WKOPTar. Określono błędy pozycjonowania ostrzy piły, której obrót jest sterowany w sposób automatyczny z wykorzystaniem obrazu ostrzy z kamery rejestrującej obraz powierzchni przyłożenia. Zaprezentowano szereg wyników pomiarów dokładności wykonania ostrzy piły.
-
Biometria - zastosowania, identyfikacja i kierunki dalszego rozwoju
PublicationBiometria - naturalna forma identyfikacji. W rozdziale zamieszczono opis różnych technik identyfikacji, takich jak rozpoznawanie dłoni, odcisków palców, twarzy, głosu i innych. Omówiono stosowane techniki ekstrakcji cech odpowiednich organów i kierunku dalszych badań nad poprawą własności systemów biometrycznych, które mają zasadnicze znaczenie w identyfikacji i weryfikacji osobniczej, oraz sposobów zwiększenia ich skuteczności.
-
Sravnitel'no-sopostavitel'nyj analiz cifrovoj reprezentacii leksem s differencirovannoj akcentuaciej
PublicationArtykuł poświęcony jest językoznawczej analizie kontrastywnej dźwięków mowy systemów języka cechujących się "płynnym" akcentowaniem homograficznych leksemów. Język rosyjski jest na wskroś reprezentatywnym przykładem takiego właśnie systemu. W prezentowanej tu metodzie analizy materiałem wyjściowym są cyfrowe nagrania mowy żywej artykułowanej przez lektorów języka rosyjskiego. Akustyczna (cyfrowa) reprezentacja leksemów o tożsamej...
-
Nowy algorytm regulacji transformatorów zasilających siec rozdzielczą
PublicationW niniejszym artykule opisano przykład nowego inteligentnego algorytmu regulatora transformatora. Układ regulacji transformatorów 110/SN, z proponowanym algorytmem działania, umożliwia automatyczne dostosowanie algorytmu działania regulatorów do aktualnych stanów systemu elektroenergetycznego (np. lawina napięcia) i w ten sposób może wpłynąć na wzrost bezpieczeństwa elektroenergetycznego.
-
Adaptacyjny algorytm regulacji transformatorów zasilających sieć rozdzielczą
PublicationW niniejszym artykule opisano przykład nowego inteligentnego regulatora transformatora. Układ regulacji transformatorów 110/SN, z proponowanym algorytmem działania, umożliwia automatyczne dostosowanie algorytmu działania regulatorów do aktualnych stanów systemu elektroenergetycznego (np. lawina napięcia) i w ten sposób może wpłynąć na wzrost bezpieczeństwa elektroenergetycznego.
-
Analiza przydatności wybranych współczynników kształtu do oceny podobieństwa do litery
PublicationPrzedstawiono analizę przydatności wybranych współczynników kształtu w celu zastosowania ich w metodzie oceny podobieństwa kształtu do litery, opartej o segmentację obrazu. Opracowane algorytmy zaimplementowano do ekstrakcji i rozpoznawanie tekstu z obrazów zarejestrowanych kamerą lub aparatem cyfrowym w naturalnym otoczeniu. Rozpoznany tekst może zostać zamieniony na postać mówioną w urządzeniach wspomagających osoby niewidome.
-
New generation artificial larynx
PublicationCelem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz....
-
Speech formant frequency and pitch estimation using instantaneous complex frequency
PublicationW pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.
-
Zagroda. Zagadnienia planowania i projektowania ruralistycznego.
PublicationOpracowanie skierowane jest do studentów architektury i urbanistyki. Przedstawia zasady budowania i funkcjonowania zagrody dawniej i dziś, jej genezę i strukturę. Opisuje rolę zagrody w kształtowaniu wiejskiego krajobrazu oraz szanse jej współczesnego udziału w kreowaniu wizerunku wsi. Czytelnicy otrzymują przewodnik, który ułatwi im samodzielne rozpoznawanie w krajobrazie kulturowym wsi relacji przestrzennych współtworzonych przez...
-
New approach to localization of clicks in archive speech signals.
PublicationPrzedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.
-
Structural determinants of imidazoacridinones facilitating antitumor activity are crucial for substrate recognition by ABCG2
PublicationW pracy zidentyfikowaliśmy elementy struktury chemicznej dla 23 pochodnych imidazoakrydonu odpowiedzialne za ich rozpoznawanie przez transporter typu ABC, białko ABCG2. za transport tych związków przez pompę ABCG2 odpowiedzialne jest grupa hydroksylowa w pozycjach R1, R2 i R3 chromoforu. Stwierdziliśmy także, że zwiększanie ilości grup metylenowych łańcucha bocznego imidazoakrydonów powodowało zmniejszenie aktywnego transportu...
-
Badania nieniszczące i monitoring elementów konstrukcji budowlanych w warunkach laboratoryjnych
PublicationW artykule przedstawiono wyniki przykładowych badań diagnostycznych elementów konstrukcji inżynierskich w warunkach laboratoryjnych metodą propagacji fal mechanicznych. Testom poddano płytę stalową, zakładkowe połączenie klejone oraz czołowe połączenie śrubowe. Badania ukierunkowano na pozyskiwanie i rozpoznawanie wzorców uszkodzeń dla elementów i defektów o znanej geometrii oraz kontrolowanym sposobie zniszczenia. Przeprowadzone...
-
Zespolona pulsacja chwilowa w analizie i konwersji głosu
PublicationPrzedstawiona rozprawa doktorska dotyczy badania głosu z wykorzystaniem reprezentacji sygnału mowy za pomocą zespolonej pulsacji chwilowej (ICF od ang. Instantaneous Complex Frequency). Zespolona pulsacja chwilowa opiera się na koncepcji rzeczywistej częstotliwości chwilowej (IF od ang. Instantaneous Frequency), która estymuje częstotliwość sygnału w każdej chwili czasu jako pochodną jego fazy chwilowej. Główną zaletą takiego podejścia...
-
Korekta akustyczna sali wykładowej Politechniki Lwowskiej
PublicationPraca omawia korektę akustyczną sali wykładowej, cechującą się dużą pogłosowością i małą zrozumiałością mowy. Sala znajduje się w zabytkowym budynku. Przedstawiono kroki prowadzące do poprawy akustyki, z uwzględnieniem ograniczeń wynikających z historycznego charakteru sali.
-
Zastosowanie koncepcji bezpieczeństwa funkcjonalnego w ocenie automatycznych synchronizatorów prądnic
PublicationW artykule podjęto próbę powiązania tematyki synchronizacji obiektów elektroenergetycznych z problematyką bezpieczeństwa funkcjonalnego. Synchronizacja automatyczna w systemie elektroenergetycznym jest bowiem od lat prowadzona z udziałem specjalistycznych urządzeń, jakimi są synchronizatory automatyczne o skomplikowanej strukturze sprzętowej i oprogramowaniu, a prawidłowy jej przebieg odgrywa istotną rolę z punktu widzenia bezpieczeństwa...
-
Broadband interference in speech reinforcement systems
PublicationArtykuł podejmuje niedoceniany problem wpływu liczby i rozkładu głośników w systemach nagłośnienia, na jakość przekazu głosowego, czyli na zrozumiałość mowy w audytoriach. Superpozycji przesuniętych w czasie szerokopasmowych sygnałów o tym samym kształcie i lekko różnych wielkościach, które docierają do słuchacza z licznych spójnych źródeł, towarzyszy zjawisko interferencji prowadzące do głębokiej modyfikacji odbieranych sygnałów...