Wyniki wyszukiwania dla: AUTOMATYCZNE ROZPOZNAWANIE MOWY

Wyniki wyszukiwania dla: AUTOMATYCZNE ROZPOZNAWANIE MOWY

wyników na stronę:
osadź ten widok na swojej stronie

Filtry

wszystkich: 279

wyczyść wszystkie filtry niedostępne

Rozpoznawanie dynamicznych i statycznych gestów rąk w zastosowaniu do sterowania aplikacjami komputerowymi
Publikacja
- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Rok 2011
W referacie przedstawiono interfejs, metody oraz algorytmy sterowania komputerem za pomocą dynamicznych i statycznych gestów rąk. Komponentami opracowanego rozwiązania są komputer klasy PC wraz z opracowanym interfejsem i oprogramowaniem, kamera internetowa oraz projektor multimedialny. Gesty rozpoznawane są w procesie analizy obrazu wizyjnego pozyskanego z kamery internetowej przymocowanej do projektora oraz analizy obrazu wyświetlanego...
Badanie właściwości sygnału telegraficznego oraz sygnału mowy przesyłanych przez kanał analogowy
Publikacja
- M. Blok
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2010
W pracy zaprezentowano oprogramowanie TELESOUND, które powstało na potrzeby ćwiczenia pt. "Właściwości źródeł informacji" realizowanego w ramach laboratorium "Podstaw telekomunikacji". W trakcie tego ćwiczenia studenci zapoznają się z podstawowymi pojęciami i mechanizmami funkcjonowania systemów telekomunikacyjnych przekazujących wiadomości na odległość poprzez kanał przestrzenny. Na przykładzie telegrafii i telefonii, studenci...

Pełny tekst do pobrania w portalu
Recognition, understanding and aestheticization of freehand drawing flowcharts
Publikacja
- W. Szwoch
- Rok 2007
In this paper a concept of FCA, a system for recognizing, understanding and aestheticization of freehand drawing flow charts is described. The system is based on a proposed by the author FlowGram graph grammar describing flow charts drawing. An open format FlowChartML for flow charts description is also proposed. The aestheticization criterion is formulated that allows for automatic beautification of flow charts. First experiments...
Rozpoznawanie ruchów i gestów wykonywanych ustami w obrazie wizyjnym z użyciem sieci neuronowych
Publikacja
- P. Dalka
- A. Czyżewski
- Rok 2013
Ustomysz jest interfejsem komputerowym, umożliwiającym sterowanie kursorem ekranowym za pomocą ruchów ust i gestów wykonywanych ustami. Główną grupą docelową użytkowników interfejsu są osoby, które z dowolnego powodu nie mogą lub nie chcą posługiwać się tradycyjną klawiaturą i myszką komputerową. W związku z tym, może on umożliwić osobom niepełnosprawnym ruchowo, np. z niedowładem kończyn posługiwanie się komputerem, a przez to...

Pełny tekst do pobrania w serwisie zewnętrznym
Rozpoznawanie cząsteczek substancji smakowych za pomocą oscylatorów z membraną ciekłą zawierających jonowe surfaktanty.
Publikacja
- Rok 2002
Badano możliwość zastosowania oscylatorów z membraną ciekłą zawierający kationowy (chlorek benzylodimetylotetradecyloamonowy) lub anionowy (oleinian sodu) surfaktant do rozpoznawania substancji odpowiedzialnych za wrażenia smakowe. Wykazano, że charakterystyki oscylacyjne są odmienne dla układów zawierających różne substancje smakowe. Można stwierdzić, że układy badane mogą być stosowane do rozróżniania substancji smakowych.
Akustyczny obraz słowa na tle mowy etnicznej [The acoustic image of ethnic speech words]
Publikacja
- K. Wojan
- Rok 2002
Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole
Publikacja
- A. Kupryjanow
- A. Czyżewski
- Rok 2009
This paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed
Surrogate models and automated cad of passive microwave components
Publikacja
- A. Lamęcki
- Rok 2007
W pracy pokazane zostały techniki modelowania złożonych układów elektronicznych wysokiej częstotliwości. Modele zastępcze mają postać sparametryzowanych modeli matematycznych tworzonych za pomocą schematów interpolacyjnych lub skupionych, pasywnych układów zastępczych dedykowanych analizie w dziedzinie czasu. Do konstrukcji modeli wykorzystywane są wyniki symulacji elektromagnetycznych, co pozwala na osiągnięcie lepszej dokładności...
Badanie rozkładów parametrów sygnału mowy w zastosowaniach do prognozowania prawdopodobieństwa popełnienia błędów w systemach identyfikacji mówców = Examining distribution of speech signal parameters for the prognosis of error probability in speaker verification systems
Publikacja
- A. Kaczmarek
- Rok 2010
Przedmiotem pracy jest system identyfikacji mówców w sposób zależny od tekstu ("text dependent''). Dokonano analizy wielu różnych wypowiedzi kilkudziesięciu mówców. Zastosowana metoda parametryzacji to metoda oparta na wynikach analizy cepstralnej sygnału mowy. Zdefiniowane zostały nowe parametry skojarzone z elementarnymi zdarzeniami w procesie weryfikacji mówców. Na tej podstawie dokonano estymacji funkcji gęstości prawdopodobieństwa...
Poprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adatacyjnej
Publikacja
- D. Ellwart
- A. Czyżewski
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2009
W pracy opisano nowy sposób wykorzystania filtracjiadaptacyjnej do poprawy jakości dźwięków uŜytecznychnagrywanych w obecności zakłóceń. Przedstawiono stworzonyalgorytm adaptacji, omówiono moŜliwości przetwarzania dźwiękudodatkowymi algorytmami, opisano przeprowadzoneeksperymenty. Zamieszczono i omówiono wyniki eksperymentów.Zaproponowano sposób integracji opracowanej metody zsystemami akustycznego monitorowania aglomeracji miejskiej.

Pełny tekst do pobrania w portalu
A low complexity double-talk detector based on the signal envelope
Publikacja
- SIGNAL PROCESSING - Rok 2008
A new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone...

Pełny tekst do pobrania w portalu
Andrzej Czyżewski prof. dr hab. inż.

Osoby

Katedra Systemów Multimedialnych

Prof. zw. dr hab. inż. Andrzej Czyżewski jest absolwentem Wydziału Elektroniki PG (studia magisterskie ukończył w 1982 r.). Pracę doktorską na temat związany z dźwiękiem cyfrowym obronił z wyróżnieniem na Wydziale Elektroniki PG w roku 1987. W 1992 r. przedstawił rozprawę habilitacyjną pt.: „Cyfrowe operacje na sygnałach fonicznych”. Jego kolokwium habilitacyjne zostało przyjęte jednomyślnie w czerwcu 1992 r. w Akademii Górniczo-Hutniczej...
Gazetteer compression technique based on substructure recognition
Publikacja
- J. Daciuk
- J. Piskorski
- Rok 2006
Automaty skończone są najlepszą formą reprezentacji słowników do przetwarzania języka naturalnego. Przedstawiamy nową technikę kompresji, która jest szczególnie użyteczna w stosunku do pewnego rodzaju słowników. Zastępujemy wielokrotnie występujące podstruktury ich niepowtarzalnymi reprezentantami. Do ich znalezienia traktujemy wektor przejść jako tekst i stosujemy technikę kompresji tekstu w stylu Ziv-Lempel, która znajduje powtórzenia...

Pełny tekst do pobrania w serwisie zewnętrznym
Cyfrowa analiza mowy etnicznej – ekstrakcja kodu informacji [A digital analysis of ethnic speech – deciphering the information code]
Publikacja
- K. Wojan
- Rok 2003
Józef Kotus dr hab. inż.

Osoby

Katedra Systemów Multimedialnych
Metodyka i system dopasowanie protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie.
Publikacja
- P. Suchomski
- Rok 2005
.
System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych [A system of speech signal processing and visualisation for linguistic purposes]
Publikacja
- K. Wojan
- Rok 2005
Transient detection for speech coding applications
Publikacja
- International Journal of Computer Science and Network Security - Rok 2006
Signal quality in speech codecs may be improved by selecting transients from speech signal and encoding them using a suitable method. This paper presents an algorithm for transient detection in speech signal. This algorithm operates in several frequency bands. Transient detection functions are calculated from energy measured in short frames of the signal. The final selection of transient frames is based on results of detection...

Pełny tekst do pobrania w serwisie zewnętrznym
Extreme value theory for detecting heavy tails of large claims / Rozpoznawanie grubości ogona rozkładów wielkich roszczeń z użyciem teorii wartości ekstremalnych
Publikacja
- M. Stachura
- B. Wodecka
- PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU - Rok 2016
Pełny tekst do pobrania w serwisie zewnętrznym
Language material for English audiovisual speech recognition system developmen . Materiał językowy do wykorzystania w systemie audiowizualnego rozpoznawania mowy angielskiej
Publikacja
- A. Czyżewski
- B. Kostek
- T. Ciszewski
- D. Majewicz
- Rok 2013
The bi-modal speech recognition system requires a 2-sample language input for training and for testing algorithms which precisely depicts natural English speech. For the purposes of the audio-visual recordings, a training data base of 264 sentences (1730 words without repetitions; 5685 sounds) has been created. The language sample reflects vowel and consonant frequencies in natural speech. The recording material reflects both the...
Recognition of hazardous acoustic events employing parallel processing on a supercomputing cluster . Rozpoznawanie niebezpiecznych zdarzeń dźwiękowych z wykorzystaniem równoległego przetwarzania na klastrze superkomputerowym
Publikacja
- K. Łopatka
- A. Czyżewski
- Rok 2015
A method for automatic recognition of hazardous acoustic events operating on a super computing cluster is introduced. The methods employed for detecting and classifying the acoustic events are outlined. The evaluation of the recognition engine is provided: both on the training set and using real-life signals. The algorithms yield sufficient performance in practical conditions to be employed in security surveillance systems. The...
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
Publikacja
- T. Bandurski
- Ł. Hamerski
- M. Papaj
- A. Paruzel
- K. Świder
- Rok 2007
In this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
Piotr Szczuko dr hab. inż.

Osoby

Katedra Systemów Multimedialnych

Dr hab. inż. Piotr Szczuko w 2002 roku ukończył studia na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej zdobywając tytuł magistra inżyniera. Tematem pracy dyplomowej było badanie zjawisk jednoczesnej percepcji obrazu cyfrowego i dźwięku dookólnego. W roku 2008 obronił rozprawę doktorską zatytułowaną "Zastosowanie reguł rozmytych w komputerowej animacji postaci", za którą otrzymał nagrodę Prezesa Rady...
Pitch estimation of narrowband-filtered speech signal using instantaneous complex frequency
Publikacja
- Elektronika : konstrukcje, technologie, zastosowania - Rok 2008
In this paper we propose a novel method of pitch estimation, based on instantaneous complex frequency (ICF). New iterative algorithm for analysis of ICF of speech signal in presented. Obtained results are compared with commonly used methods to prove its accuracy and connection between ICF and pitch, particularly for narrowband-filtered speech signal.
High quality speech codec employing sines+noise+transients model
Publikacja
- Archives of Acoustics - Rok 2006
A method of high quality wideband speech signal representation employing sines+transients+noise model is presented. The need for a wideband speech coding approach as well as various methods for analysis and synthesis of sines, residual and transient states of speech signal is discussed. The perceptual criterion is applied in the proposed approach during encoding of sines amplitudes in order to reduce bandwidth requirements and...

Pełny tekst do pobrania w portalu
Aleksandra Giełdoń - Paszek dr hab.

Osoby

Doktor habilitowany w dziedzinie nauk o sztuce, historyk sztuki. Studiowała historię sztuki na Wydziale Filozoficzno-Historycznym Uniwersytetu Jagiellońskiego w Krakowie. W roku 2002 na Wydziale Historycznym tejże uczelni uzyskała tytuł doktora nauk humanistycznych w zakresie nauk o sztuce na podstawie dysertacji: Malarstwo pejzażowe a szkolnictwo artystyczne w Polsce (do 1939 roku). W roku 2015 została doktorem habilitowanym w...
Jan Daciuk dr hab. inż.

Osoby

Katedra Inteligentnych Systemów Interaktywnych

Jan Daciuk uzyskał tytuł zawodowy magistra na Wydziale Elektroniki Politechniki Gdańskiej w 1986 roku, a doktorat na wydziale Elektroniki, Telekomunikacji i Informatyki PG w 1999. Pracuje na Wydziale od 1988 roku. Jego zainteresowania naukowe obejmują zastosowania automatów skończonych w przetwarzaniu języka naturalnego i przetwarzaniu mowy. Spędził ponad cztery lata w europejskich uniwersytetach i instytutach naukowych, takich...
Speech codec enhancements utilizing time compression and perceptual coding
Publikacja
- M. Kulesza
- A. Czyżewski
- Rok 2007
A method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband...
Rozpoznawanie uszkodzeń w części przepływowej okrętowego turbinowego silnika spalinowego na podstawie wyników badania endoskopowego = Failures' recognising within the passages of a marine gas turbine engine on the basis of results of endoscopic investigation
Publikacja
- Z. Korczewski
- Eksploatacja i Niezawodność - Maintenance and Reliability - Rok 2010
The paper deals with diagnostic issues concerning endoscopic examinations of marine gas turbine engines. There will be presented selected information about failures within the passages and accessible endoscopic methods and means enabling their detection. The author focuses on the endoscopic techniques and widely presents the possibilities of this quickly developed diagnostic method. There will be also presented representative results...

Pełny tekst do pobrania w portalu
Stanisław Szczepański prof. dr hab. inż.

Osoby

Katedra Systemów Mikroelektronicznych
Janusz Górski prof. dr hab. inż.

Osoby
Rozpoznawanie drukowanej notacji muzycznej z wykorzystaniem bezkonteksto-wych gramatyk atrybutowych.**2002, 139 s. 65 rys. 9 tab. bibliogr. 170 poz. maszyn. Rozprawa doktorska /15.07.2002/ Wydz. ETI. Promotor: doc. dr hab. inż. W. Malina.
Publikacja
- M. Szwoch
- Rok 2002
.
Multitask Noisy Speech Enhancement System
Publikacja
- A. Czyżewski
- J. Kotus
- G. Szwoch
- M. Dziubiński
- A. Rypulak
- A. Pawlik
- Rok 2005
W referacie opisano Wielozadaniowy System Poprawy Jakości Sygnału Mowy. Jest to wyspecjalizowany pakiet oprogramowania przeznaczony do rejestrowania sygnału mowy i do poprawy jego jakości oraz zrozumiałości mowy, przy użyciu zaawansowanych procedur cyfrowego przetwarzania sygnału. Pakiet oprogramowania składa się z programów: Rejestrator, Przeglądarka oraz Rekonstruktor. Oprogramowanie to może być użyte w przypadkach, gdy zrozumiałość...
New generation speech aid for stuttering people
Publikacja
- P. Odya
- A. Czyżewski
- Rok 2008
Współczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...

Pełny tekst do pobrania w portalu
New generation speech aid for stuttering people
Publikacja
- P. Odya
- A. Czyżewski
- Archives of Acoustics - Rok 2008
Współczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów...

Pełny tekst do pobrania w portalu
Automatic prosodic modification in a Text-To-Speech synthesizer of Polish language
Publikacja
- K. Łopatka
- P. Suchomski
- A. Czyżewski
- Elektronika : konstrukcje, technologie, zastosowania - Rok 2011
Przedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany...
A system for multitask noisy speech enhancement.
Publikacja
- A. Czyżewski
- A. Kaczmarek
- J. Kotus
- A. Pawlik
- A. Rypulak
- P. Żwan
- Rok 2004
W artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy...
Special hearing aid for stuttering people
Publikacja
- P. Odya
- A. Czyżewski
- Rok 2007
Dzięku postępowi w dziedzienie cyfrowego przetwarzania sygnałów możliwe stało zbudowanie subminiaturowego urządzenia łączącego funkcje aparatu słuchowego i korektora mowy. Takie urządzenie, mimo niewielkich rozmiarów, jest w stanie wykonywać skomplikowane alggorytmy a jego oprogramowanie może być łatwo zmieniane. W pracy skupiono się na zagadnieniach związanych z opracowniem prototypu i implementacją algorytmów korekcji słuchu...
Application of hybrid signals processors to speech and hearing aids
Publikacja
- P. Odya
- A. Czyżewski
- Rok 2005
Dzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...
New digital aids for pateints after laryngectomy
Publikacja
- A. Czyżewski
- J. Kozłowski
- M. Kulesza
- P. Odya
- A. Szkiełkowska
- Rok 2006
Powrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej...
Korekta akustyczna sali audytoryjnej Politechniki Śląskiej w Rybniku.
Publikacja
- T. Kamisiński
- A. Kulowski
- Rok 2003
Omówiono korektę akustyczną sali audytoryjnej Politechniki Śląskiej w Rybniku. Przyczyną dokonania korekty była mała zrozumiałość mowy a powodowana nadmierną pogłosowością sali. Rozpatrzono wpływ rezonansu galerii na akustykę sali. Mimo ograniczonej ingerencji w architekturę sali związanej z zabytkowym charakterem budynku, korekta akustyczna znacząco poprawiła zrozumiałość mowy w sali.
Rafał Leszczyna dr hab. inż.

Osoby

Katedra Informatyki w Zarządzaniu

Dr hab. inż. Rafał Leszczyna jest profesorem uczelni na Wydziale Zarządzania i Ekonomii Politechniki Gdańskiej. W lipcu 2020 r., na podstawie osiągnięcia naukowego w obszarze zarządzania cyberbezpieczeństwem infrastruktur krytycznych w sektorze elektroenergetycznym, uzyskał stopień doktora habilitowanego w dziedzinie nauk inżynieryjno-technicznych, dyscyplina informatyka techniczna i telekomunikacja. W latach 2004–2008 pracował...
System wizyjny sterujący zrobotyzowanym stanowiskiem spawania wymienników ciepła
Publikacja
- P. Fiertek
- Rok 2006
W pracy przedstawiono system wizyjny, służący do sterowania pracą zrobotyzowanego stanowiska spawania. Zadaniem systemu jest rozpoznawanie spawanego obiektu oraz wygenerowanie odpowiedniej trajektorii palnika robota na podstawie otrzymanej informacji wizyjnej.

Pełny tekst do pobrania w portalu
Quality evaluation of computer aided information retrieval from machine typed paper documents
Publikacja
- Rok 2003
Celem międzynarodowego projektu memorial jest wspomagane komputerowo rozpoznawanie maszynopisów. Referat prezentuje zagadnienie pomiaru jakości takiego procesu. Wskazano w nim potencjalne miejsca pojawiania się błędów oraz przedstawiono i sklasyfikowano odpowiednie miary.
Automatic synthesis of parametric images in dynamic MRI imaging
Publikacja
- J. Rumiński
- B. Karczewski
- Rok 2005
Artykuł opisuje automatyczne metody czasu dojścia kontrastu (BAT) i tętniczą funkcję wejścia (AIF). Metody te porównano dla klinicznych i symulacyjnych danych.
Moje refleksje po ukończeniu 75 lat.
Publikacja
- Z. Cywiński
- Rok 2004
Szkic stanowi streszczenie mowy, jaką wygłosił autor na uroczystości swego 75-lecia.
Low-order models from FD-TD time samples
Publikacja
- P. Kozakowski
- M. Mrozowski
- IEEE MICROWAVE AND WIRELESS COMPONENTS LETTERS - Rok 2002
Niniejszy artykuł zawiera opis szeregu kryteriów pozwalających na automatyczne tworzenie wysokiej jakości modeli sygnałów czasowych uzyskanych w drodze symulacji obwodów wysokiej częstotliwości metodą różnic skończonych w dziedzinie czasu. Podany jest szczegółowy opis selekcji kluczowych parametrów modeli takich jak wybór długości ciągu użytego do konstrukcji modeli, współczynnika decymacji silnie nadpróbkowanego przebiegu w dziedzinie...
Online pitch estimation using instantaneous complex frequency
Publikacja
- M. Kaniewska
- Rok 2011
W pracy opisano nowe wyniki dotyczące skuteczności algorytmu potokowego estymującego częstotliwość podstawową sygnału mowy. Algorytm wykorzystuje zespoloną pulsację chwilową dla klasyfikacji mowy na dźwięczną i bezdźwięczną oraz estymacji częstotliwości podstawowej dla każdej próbki sygnału. Skuteczność klasyfikacji oraz dokładność estymacji zostały ocenione eksperymentalnie z wykorzystaniem dwóch baz nagrań, zawierających wypowiedzi...

Pełny tekst do pobrania w serwisie zewnętrznym
Estimation the rhythmic salience of sound with association rules and neural networks
Publikacja
- B. Kostek
- J. Wójcik
- P. Holonowicz
- Rok 2005
W referacie przedstawiono eksperymenty mające na celu automatyczne wyszukiwanie wartości rytmicznych we frazie muzycznej. W tym celu wykorzystano metody data mining i sztuczne sieci neuronowe.
Ewa Hermanowicz prof. dr hab. inż.

Osoby

Wyszukiwarka

Filtry

Katalog

Wyniki wyszukiwania dla: AUTOMATYCZNE ROZPOZNAWANIE MOWY

Andrzej Czyżewski prof. dr hab. inż.

Józef Kotus dr hab. inż.

Piotr Szczuko dr hab. inż.

Aleksandra Giełdoń - Paszek dr hab.

Jan Daciuk dr hab. inż.

Stanisław Szczepański prof. dr hab. inż.

Janusz Górski prof. dr hab. inż.

Rafał Leszczyna dr hab. inż.

Ewa Hermanowicz prof. dr hab. inż.